第二届人工智能数学奥林匹克竞赛正在进行,经过严格审核,阿里前几天发布的推理模型QwQ-32B受到了大赛组织的认可,被纳入了竞赛模型白名单
AIMO 奖项旨在推动能够进行数学推理以解决问题的 AI 模型的开放发展。这一领域是知识和科学发现的新前沿,而 AIMO 奖项可能被视为一种新的图灵测试
AIMO 奖项提出了三项初步设计原则:
陶哲轩关注竞赛动态&认可阿里QwQ-32B模型
著名数学家陶哲轩(Terence Tao,AIMO咨询委员会委员)在社交媒体上对AIMO的进展表达了高度关注,他提到:
第二届人工智能数学奥林匹克竞赛(AIMO)的挑战赛已持续约一个月,目前正在接近公共排行榜上的20/50(陶哲轩发文前)门槛,这一门槛将触发“早期分享奖”,奖励给第一个达到门槛并分享其笔记本的参赛者
最近进展的关键之一是一个新的白名单审批流程(Simon Frieder领导),这一流程批准了一个功能强大的新开源模型——QwQ-32B的特定实例——与之前的开源模型相比,该模型似乎在这类竞赛问题上表现更出色
目前已经有几名参赛选手的提交达到了20/50(50次提交获得20分)
白名单流程:推动竞赛创新的核心
这次竞赛的一大突破来自一种全新的“白名单审批”流程(whitelisting process)。在Simon Frieder的带领下,这一流程成功地批准了一个强大的开源模型——QwQ-32B的特定版本。根据测试结果,QwQ-32B模型在解决竞赛中的数学问题上表现显著优于以往的开源模型。Frieder表示,这种白名单流程不仅支持社区参与,还严格遵守了开放科学的原则。
白名单审批的关键规则:
-
1. 参赛者需要证明现有模型无法满足需求,并说明为何申请的模型更适合解决问题
-
2. 必须提供模型的开源许可链接,以及模型所在的可信平台(如HuggingFace)上的具体提交版本
-
3. 确保模型的使用和开放科学的基本原则一致,例如公平性和可复现性
Frieder还鼓励社区对所有白名单申请进行公开讨论和反馈,确保每一个被批准的模型都经过严格的审查和验证。这种透明的参与机制不仅提高了竞赛的公平性,也为整个AI社区的技术共享树立了标杆
目前使用最多的模型排名前5名
⭐星标AI寒武纪,好内容不错过⭐
用你的赞和在看告诉我~
(文:AI寒武纪)