
新智元报道
新智元报道
【新智元导读】高考数学满分AI出现了!豆包爱学App首次公开挑战高考数学全国卷,由6位资深名师严格把关,主观题步骤全打分,竟然斩获Ⅰ卷144分、Ⅱ卷150分满分战绩。这个惊艳的成绩或许预示着,AI教育真要变天了。
不过对于各个版本的AI解题评分是否公正,坊间一直颇多争议。
我们突然发现,一位高考数学满分选手出现!
我们在豆包爱学的官方账号看到,考试结束后,豆包爱学第一时间将结果放到了网上。
豆包爱学App的AI深度解题能力(即豆包大模型教育版),直接获得了高考数学全国Ⅰ卷144分、全国Ⅱ卷150分满分。

来源:豆包爱学(豆包大模型教育版),2025高考数学全国Ⅱ卷满分!
而且它的得分,是由六位平均教龄超10年的一线资深数学教师给出的,甚至对解答题的步骤进行了严格打分,可以说,这个分数十分有含金量了。


下面我们来看看,豆包大模型教育版对于2025高考数学全国卷中部分选择题、填空题、问答题的解答情况。
先来看一道让一众大模型闻风丧胆的选择题,全国Ⅰ卷第6题。
这道题AI之所以很难做对,是因为它既有文字、又有图表、图片。
不仅需要模型的多模态能力,还要有很好的信息整合能力。
尤其是模型还要理解图中向量的方向,然后进行推理计算,这对模型极其困难。

来看看豆包大模型教育版的表现。
它的回答有两点让人印象深刻,甚至惊艳。
首先,它在思考过程中消耗的token数非常少,比行业里其他大模型都要精简很多。尽管在整个过程中检查了3次。
经常用推理模型的同学肯定都见过那些长到可以让人发狂的思考过程。
其次是它的公式渲染能力,基础的绝对值、根号这些就不说了,它连向量上边的小箭头都渲染的很好了。
读起来专业又舒服。
最后简单说下它的解题过程,流畅又有逻辑,简洁而准确。
上下滑动查看
说完了最让模型挠头的题,再来看试卷中最难的题——压轴题。
这是一道导数计算证明题,使用的三角函数。

我们来看豆包大模型教育版是如何应对的。
思路同样清晰。
这个过程中,模型还有几个有趣的表现。
例如,拿到简化结果后,它会惊讶。

对变量替换法、反证法这些常用的方法,掌握得非常娴熟。


还有就是可以快速锁定问题的本质。

完整思考过程及结果如下。
上下滑动查看
接下来,看一下模型对于II卷的解题结果。
对于几道选择题,模型是手拿把掐、不在话下,解题过程非常丝滑。
单项选择题1:

这道题涉及到实数和虚数的知识点,模型在分布推理后,得到了正确答案A。
上下滑动查看
单项选择题2:

这道选择题,应用到了余弦定理。
模型在思考过程中,找出解题关键——需要用余弦定理求角A,最终得出了正确答案A。
上下滑动查看
单项选择题3:

在解题过程中,模型利用了抛物线的定义和直线方程的性质,最后得出正确答案C。
上下滑动查看
多项选择题,模型也是不会放过一个正确答案。
多项选择题4:

这道题涉及到知识点是等比数列,模型通过构建了一个关于首项a_1和公比q的方程组来求解,最终得出了正确选项A、D。
上下滑动查看
多项选择题5:

这道题涉及到了双曲线的知识点,模型通过求解以F_1F_2为直径的圆与渐近线的交点,再推导a、b的关系,利用向量点积公式,得出了A、C、D三个正确答案。
上下滑动查看
对于填空题,模型的求解过程也是十分丝滑。
填空题1:

在这道填空题中,模型推理出要计算结果,就需要让铁球满足「与圆柱底面、顶面、侧面相切,且两球自身相切」的极限条件,最终通过计算和验证,得出正确答案5/2cm。
上下滑动查看
然后到了真刀真枪测实力的大题环节。
解答题1:

对于这道几何题,模型首先将直线A’B的方向向量与屏幕CD’F的法向量进行点积运算,通过结果为0,成功证明直线A’B平行于平面CD’F。
随后在第二步中,通过转向二面角计算、求解第一和第二个法向量、计算法向量夹角的余弦,最终得出了正确的正弦值。
上下滑动查看
解答题2:

这道大题既包括计算,还包括证明,难度不小。
模型通过求导,分析f’(x)在(0,+∞)的符号,证明了存在唯一零点。随后通过分析g’(t)的正负确定了g(t)单调性,进而并完成了大小比较,三个问题全部给出了正确解答。
上下滑动查看
解答题3:

对于这道概率题,模型首先计算出了p_3,p_4的概率,然后得到关于p和q的简洁关系式,得出了p正确的值。
到了最后一问的证明,题目难度已经飙到极高。
为了成功完成证明,模型引入了一个辅助数列,这样就将需要证明的不等式转化为了分析新数列项与项之间的差值。
经过严谨的推理后,最终它成功完成了证明。
上下滑动查看
看完这些解题过程,可能你会疑问:这么好的成绩,真的是全靠模型做出来的吗?会不会是每次都取最好成绩,才有的这个结果?
看完下面这个过程,你就可以打消顾虑了——豆包大模型教育版的数学解题能力,就是这么牛!

经常使用AI做题的小伙伴肯定都有体会,那就是现阶段的AI答题并不稳定。
有些模型很不稳定,简单些的还好,遇到难一点的题目,需要试好几次才能得到一个满意的答复。
如果模型性能不行就更别提了,彻底摆烂,答不对不说,还会时常一本正经地胡言乱语。
这就使得AI解题看上去不那么实用:你很难判断它首次给出的答案是不是对的——我如果知道正确答案,还请AI干嘛呢?
所以,AI答题正确的稳定性至关重要。
为了避免随机性,根据公布的结果看,此次豆包爱学测了五次,同时前五遍结果发到了HuggingFace上。

可以看出,每道题分别列出了思考过程<thinking>与输出答案<output>,只有每次都答对才算过关。
要求相当严苛,结果相对公正。
这也说明了豆包大模型教育版解题稳定性很高。

不仅,如此,豆包大模型教育版此次答题的评分过程,还经过了不少名师把关!
为了得到足够严谨的测评结果,豆包爱学App特意邀请了6位平均教龄超10年、毕业于知名高校的一线教学、阅卷岗位的资深数学教师,对作答结果进行了详细的交叉评分。
最终评分结果为——全国Ⅰ卷:144分、全国Ⅱ卷:150分(满分)。
这一结果充分证明了豆包大模型教育版在解题结果方面出色的能力,能在几位名师手里拿到满分,更是说明了模型在解题过程中推理逻辑缜密、步骤精准,符合评分细则。
而在测评过程中,这些资深数学老师们也发现了豆包大模型教育版的一些有意思的细节。
比如,赵武俊老师发现,模型再在解Ⅰ卷最后一题的最后一问时,推理的过程「特别像考生作答的这种感觉」。
所以,看模型的解题思考过程就好像是在看自己的解答过程一样,十分有启发。

李想老师则给出了更加详细的使用建议。
例如,他建议利用模型解答立体几何部分的题目时,可以让AI给出常规定义法和空间向量法两种方法。
这样,就可以直观地比较出到底哪种方法更加适合自己,而且也更加贴近高中的教学内容。

当然,在测评过程中名师们也发现了模型现在在解题过程中存在的一些问题。
比如,曾多次参与高考集中阅卷的杨春晖老师就发现,部分解题过程可能会出现高中未学的技巧与公式。

韩晓乐老师也发现了数字之间的乘法符号使用点乘、点坐标结果未化简等问题。
当然,上面出现的这些问题也不是没有解决办法。
比如,我们可以要求模型解题时使用高中的知识,解题步骤中即时化简等。

在经过深入的体验与测试后,李伟景老师对豆包大模型教育版给出了高度评价,总结道:豆包大模型教育版无论是「对教师授课还是学生自学都非常有用,未来将有很大帮助。」
对于教师来说,豆包大模型教育版就像一位得力的教学助手。
它能够快速生成多样化的教学思路,涵盖课程设计、课堂互动到知识点讲解等方方面面,帮助老师更高效地备课和授课。
无论是需要梳理复杂的知识框架,还是设计生动有趣的教学活动,模型都能提供全面且实用的建议,让课堂更加生动、条理清晰,大大提升教学效果。
对于学生,这款模型同样是一个强大的学习伙伴。
它能够根据学生的需求,清晰地拆解题目,提供详细且易懂的解题步骤,帮助学生快速掌握解题方法和核心知识点。
无论是数学的逻辑推导、语文作文的分析,还是其他学科的疑难问题,豆包大模型教育版都能以通俗易懂的方式引导学生逐步攻克难点,从而有效提高学习效率和考试成绩。
堪称学习神器!

在亲自实测了豆包大模型教育版的解题过程后,小编最强烈的感受就是——
它的思考过程完全透明,每一步的解析都很明确,不仅能拿高分,还能讲明白。这样,就能让学生获得高质量的一对一讲解。
从此,学数学可以不再只靠「刷题」,而是通过大模型的帮忙,养成严谨的推理能力,和直觉式的解题思路。
在AI做题和讲解的帮助下,学生可以给自己来一个「自我诊断」,搞清楚自己是错在哪里,是计算失误、逻辑混乱还是审题不清?
在教育资源不均的地区,弱势学生也能更公平地获得好「老师」。
总之,豆包大模型教育版这位「高考数学」满分选手的惊艳表现,不仅展示了目前AI大模型做题的实力,更是对未来教育模式的一次前瞻性预演。
AI教育,未来可期!
(文:新智元)