时隔一年,再次使用7个国产AI大模型写高考作文,国产模型的进步也太大了!有彩蛋。

开头当然要先预祝莘莘学子高考必胜!


每年的高考作文都是备受关注的焦点。


去年的6月7号,写了同样的一篇文章来评测国产模型写高考作文的能力,当时各家模型都或多或少的出现了一些问题。


“首先,其次,再次,此外”诸如此类的词汇实在是太多,导致读起来有流水账的感觉,KIMI甚至连字数都没写够。


然而今年,国产AI模型真的崛起了,能力有了指数级提升,文采好得惊人。作为人类,也是曾经的高考考生,自愧不如。



今年选择了7个国产模型来参加高考语文作文测试,用DeepSeek来打分。(如有thinking模式都会打开)


每家模型只有一次机会,跟高考一样,今年考不好就得复读一年明年再战了。


参赛选手:KIMI、豆包、腾讯元宝、通义千问、文心一言、讯飞星火、DeepSeek


阅卷评委:DeepSeek


PS:DeepSeek的文采实在是太好了,只好让它来自己给自己评分了。


文末有彩蛋哦~


评分



Kimi去年没写够字数,今年真是发了力,写了1700多字,作文纸上能写开吗?


DeepSeek跟通义千问居然没有写够字数,但是文笔依然是很不错。


但是要说扣题,还是通义千问和文心一言真的牛。


下面这是去年的评分表,可以看到各考试都有了明显的进步。



去年出现的问题也比较少了。


下面是去年AI模型写的文章,帮大家回顾下,就知道今年国产AI模型的进步有多大了。



2025年内容PK


豆包



讯飞星火



通义千问



Kimi



DeepSeek



文心一言



腾讯元宝



彩蛋


海外模型在国内真的有很多场景水土不服,拿0分真的也是正常了。


Grok绞尽脑汁审题,思考了606秒!



结果写的文章标题艺术的力量,这不是妥妥的跑题了吗。



Gemini也是,直接写了篇万字长文,真是惊呆我。



总结


历时一年,国产模型真的大转变,那股子浓浓的AI味儿没了。


文采的提升,真的不只是一点点,是质的飞跃。


写文章的能力,现在各家都差不多了,在数学推理上,可能差距还是会比较大的。


等过几天数学考试的时候,肯定比拼更加精彩,咱们拭目以待。


记得点个关注哦~~咱们下期内容见~~


扫码加入AI交流群

获得更多技术支持和交流

(请注明自己的职业)


 关注「开源AI项目落地」公众号

(文:开源AI项目落地)

发表评论

×

下载每时AI手机APP

 

和大家一起交流AI最新资讯!

立即前往