
新智元报道
新智元报道
【新智元导读】2025年,中国大模型迎来最高光时刻。DeepSeek凭借深度推理、低成本强势崛起,中科院系AI企业祭出的YAYI-Ultra大模型在代码能力上超越GPT-4o,成功跻身OpenCompas榜单全球前十,高精度和低能耗兼而有之。
-
其一,凭借技术优势,DeepSeek一举进入国际大模型头部梯队,这给国内大模型公司看到了弯道超车的可能性。
-
其二,DeepSeek的训练成果,打破了算力受限的问题,证明通过算法优化,同样可以以低算力训练出高质量的模型。

-
代码生成:LiveCodeBench排名第五,表现优于GPT-4o-20241120版本 -
复杂指令理解:IFEval排名第九 -
知识推理能力:MMLU-Pro排名第九


一手实测:超长文输出,复杂任务规划精准拿捏
01 视觉理解再升级:懂语言,更懂图表
prompt:2000年前后,哪个价格区间的物业费占比变化最多?


prompt:How did the distribution of agriculture-related employment change between 2012 and 2022? Did it increase or decrease, and by what percentage or amount? Answer in Chinese。


02 表格智解:万千表格不在话下
prompt:每种报告类型的数量是多少?


prompt:哪个基座模型使用IKE方法后局部性下降最多?


03 Function Call:复杂任务智能规划

04 多模态输出:图文并茂,直观简洁

prompt:写一篇30000字的中国儒家文化发展历史分析报告

prompt:请根据
(文:新智元)