中兴星云拿下推理总分榜一!SuperCLUE 5月成绩出炉



  新智元报道  

编辑:编辑部
【新智元导读】就在刚刚,中兴通讯星云大模型获推理榜总分第一,总榜并列第二!而在数学推理、科学推理、代码生成的细分赛道上,它同样表现抢眼。更难得的是,它是业内少数通过国家级权威安全认证的大模型。

2025年,全球AI大模型竞赛进入白热化阶段。

中文大模型测评基准SuperCLUE最新发布的《中文大模型基准测评2025年5月报告》显示:中兴通讯自主研发的星云大模型Nebula Coder-V6在竞争激烈的推理专项榜单中强势摘金,总分并列第一,同时在综合总榜中斩获银牌(并列第二),彰显了中兴通讯在AI核心赛道的前沿创新实力。

图源:SuperCLUE《中文大模型基准测评2025年5月报告》


推理能力登顶
数学与科学逻辑的「双优生」


SuperCLUE推理榜单深度聚焦模型的逻辑思维与问题解决能力,涵盖数学推理、科学推理、代码生成三大硬核维度。

Nebula Coder-V6以总分67.4的优异成绩登顶,其细分表现也非常亮眼:

  • 数学推理62.39分,在全部测评模型中高居第三,超越OpenAI o4-mini、谷歌Gemini 2.5 Pro等国际巨头,展现强大数理逻辑;

  • 科学推理53.19分,全榜单最高分,在复杂科学概念理解与推演中展现绝对统治力;

  • 代码生成86.59分,稳居第一梯队,工程实践能力扎实可靠。

图源:SuperCLUE《中文大模型基准测评2025年5月报告》


安全双认证
打造企业级AI的「可信底座」


除技术性能领先外,Nebula Coder-V6率先通过国家级权威安全认证,成为业内少数拥有「双安全认证」的大模型产品。

「大模型产品安全性检验证书」由中国软件评测中心和中国计算机行业协会数据安全专业委员会联合颁发,经联合检测,中兴星云大模型符合指令安全、内容安全、模型安全、网络安全和数据安全的A级安全性要求。

「信息安全风险评估认证证书」是由CCRC认证企业实施的大模型安全类测评。经绿盟科技评估,中兴数字星云大模型符合方案设计、建设实施、安全保障、风险识别、风险分析、风险处置的资质要求。

推理是AI的皇冠,安全是应用的基石。

在AI重塑产业格局的当下,中兴通讯以星云大模型为支点,持续释放「创新 + 安全」的乘数效应,为全球AI生态注入中国智慧。

未来,中兴通讯将继续依托自身的创新与研发优势,持续打磨星云大模型,在全球大模型竞争中占据更有利的位置,为推动AI技术的广泛应用和产业发展贡献更多力量。




(文:新智元)

发表评论

×

下载每时AI手机APP

 

和大家一起交流AI最新资讯!

立即前往