国产大模型参加数学高考,第一名却是他俩
今年高考,数学难度引起热议。为此,多家国产大模型参加了全国卷一的数学测试。结果显示,部分大模型表现亮眼,如豆包Seed1.5、智谱Z1满分通过;而Qwen3和千问Kimi等表现不佳。测试旨在考察大模型在深度问题上的能力。
今年高考,数学难度引起热议。为此,多家国产大模型参加了全国卷一的数学测试。结果显示,部分大模型表现亮眼,如豆包Seed1.5、智谱Z1满分通过;而Qwen3和千问Kimi等表现不佳。测试旨在考察大模型在深度问题上的能力。
国内和国外的大模型在解答题考试中表现各异,豆包Seed1.5、混元T1、讯飞星火X1和Gemini 2.5 pro表现出色,得分满分;Qwen3及格,DeepSeek因超时得0分。