开头当然要先预祝莘莘学子高考必胜!
每年的高考作文都是备受关注的焦点。
去年的6月7号,写了同样的一篇文章来评测国产模型写高考作文的能力,当时各家模型都或多或少的出现了一些问题。
“首先,其次,再次,此外”诸如此类的词汇实在是太多,导致读起来有流水账的感觉,KIMI甚至连字数都没写够。
然而今年,国产AI模型真的崛起了,能力有了指数级提升,文采好得惊人。作为人类,也是曾经的高考考生,自愧不如。

今年选择了7个国产模型来参加高考语文作文测试,用DeepSeek来打分。(如有thinking模式都会打开)
每家模型只有一次机会,跟高考一样,今年考不好就得复读一年明年再战了。
参赛选手:KIMI、豆包、腾讯元宝、通义千问、文心一言、讯飞星火、DeepSeek
阅卷评委:DeepSeek
PS:DeepSeek的文采实在是太好了,只好让它来自己给自己评分了。
文末有彩蛋哦~
评分

Kimi去年没写够字数,今年真是发了力,写了1700多字,作文纸上能写开吗?
DeepSeek跟通义千问居然没有写够字数,但是文笔依然是很不错。
但是要说扣题,还是通义千问和文心一言真的牛。
下面这是去年的评分表,可以看到各考试都有了明显的进步。

去年出现的问题也比较少了。
下面是去年AI模型写的文章,帮大家回顾下,就知道今年国产AI模型的进步有多大了。

2025年内容PK
豆包

讯飞星火

通义千问

Kimi


DeepSeek

文心一言

腾讯元宝

彩蛋
海外模型在国内真的有很多场景水土不服,拿0分真的也是正常了。
Grok绞尽脑汁审题,思考了606秒!

结果写的文章标题艺术的力量,这不是妥妥的跑题了吗。

Gemini也是,直接写了篇万字长文,真是惊呆我。

总结
历时一年,国产模型真的大转变,那股子浓浓的AI味儿没了。
文采的提升,真的不只是一点点,是质的飞跃。
写文章的能力,现在各家都差不多了,在数学推理上,可能差距还是会比较大的。
等过几天数学考试的时候,肯定比拼更加精彩,咱们拭目以待。
记得点个关注哦~~咱们下期内容见~~
扫码加入AI交流群
获得更多技术支持和交流
(请注明自己的职业)

关注「开源AI项目落地」公众号
(文:开源AI项目落地)