获陶哲轩认可！阿里QwQ-32B入选「AI数学奥林匹克竞赛」白名单模型

第二届人工智能数学奥林匹克竞赛正在进行，经过严格审核，阿里前几天发布的推理模型QwQ-32B受到了大赛组织的认可，被纳入了竞赛模型白名单

AIMO 奖项旨在推动能够进行数学推理以解决问题的 AI 模型的开放发展。这一领域是知识和科学发现的新前沿，而 AIMO 奖项可能被视为一种新的图灵测试

AIMO 奖项提出了三项初步设计原则：

1. AI 模型必须以与人类参赛者相同的格式接收问题，并生成符合标准奥林匹克竞赛评分标准的、专家小组可评估的、可读性良好的解决方案

2. 特等奖将授予在 AIMO 批准的比赛中表现达到相当于国际数学奥林匹克竞赛（IMO）金牌水平的 AI 模型

3. 参赛者必须在奖项颁发前遵守 AIMO 的公共共享协议，才有资格获奖

陶哲轩关注竞赛动态&认可阿里QwQ-32B模型

著名数学家陶哲轩（Terence Tao,AIMO咨询委员会委员）在社交媒体上对AIMO的进展表达了高度关注，他提到：

第二届人工智能数学奥林匹克竞赛（AIMO）的挑战赛已持续约一个月，目前正在接近公共排行榜上的20/50（陶哲轩发文前）门槛，这一门槛将触发“早期分享奖”，奖励给第一个达到门槛并分享其笔记本的参赛者

最近进展的关键之一是一个新的白名单审批流程（Simon Frieder领导），这一流程批准了一个功能强大的新开源模型——QwQ-32B的特定实例——与之前的开源模型相比，该模型似乎在这类竞赛问题上表现更出色

目前已经有几名参赛选手的提交达到了20/50（50次提交获得20分）

白名单流程：推动竞赛创新的核心

这次竞赛的一大突破来自一种全新的“白名单审批”流程（whitelisting process）。在Simon Frieder的带领下，这一流程成功地批准了一个强大的开源模型——QwQ-32B的特定版本。根据测试结果，QwQ-32B模型在解决竞赛中的数学问题上表现显著优于以往的开源模型。Frieder表示，这种白名单流程不仅支持社区参与，还严格遵守了开放科学的原则。

白名单审批的关键规则：

1. 参赛者需要证明现有模型无法满足需求，并说明为何申请的模型更适合解决问题
2. 必须提供模型的开源许可链接，以及模型所在的可信平台（如HuggingFace）上的具体提交版本
3. 确保模型的使用和开放科学的基本原则一致，例如公平性和可复现性

Frieder还鼓励社区对所有白名单申请进行公开讨论和反馈，确保每一个被批准的模型都经过严格的审查和验证。这种透明的参与机制不仅提高了竞赛的公平性，也为整个AI社区的技术共享树立了标杆

目前使用最多的模型排名前5名

⭐星标AI寒武纪，好内容不错过⭐

用你的赞和在看告诉我～

👇👇

（文：AI寒武纪）

一	二	三	四	五	六	日
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30	31

陶哲轩关注竞赛动态&认可阿里QwQ-32B模型

白名单流程：推动竞赛创新的核心

发表评论 取消回复

发表评论取消回复