金牌选手惨败!Google DeepMind 最新推出AlphaGeometry2 碾压国际奥数冠军

这次,AI 终于将数学奥林匹克金牌按在地上摩擦了!

Google DeepMind最新推出的AlphaGeometry2(AG2)直接干翻了国际数学奥林匹克竞赛(IMO)的黄金标准——这个AI现在能解决2000-2024年84%的几何题。

仅仅数月,就把初代54%的成绩甩出了八条街!

四大杀器解锁超能力

第一招:语言系统全面升级

AG2现在能处理「会动的几何体」这种变态题型,还能解析角度比例方程和距离方程式。

这让它的解题覆盖率从66%暴涨到88%,相当于从普通学霸进化成几何百科全书。

第二招:特种部队式搜索算法

新开发的SKEST算法就像派出多支特种部队:每支队伍探索不同解题路线,还能实时共享情报。

这种「群殴战术」让搜索效率直接起飞,复杂证明题瞬间被撕成碎片。

第三招:推理引擎速度狂飙

DDAR2引擎处理「双重坐标点」这种坑人陷阱时,3.4秒就能搞定——比前代快300倍!

研究员们给它装上了全新规则库,现在连最会玩文字游戏的题目都能一眼识破。

第四招:三亿定理喂养大脑

基于Gemini架构的AG2,被灌输了3亿条人造定理。训练到250步时就已经能解27道题,活脱脱一个「做题永动机」。

人类数学家的新对手

在最新测试中,AG2横扫42道近25年的IMO几何真题。

要知道,这成绩已经超过历年金牌得主的平均水平!

更可怕的是,它现在已经是2024年IMO银牌水准的「参赛选手」。

未来将掀翻整个奥数?

虽然现在还搞不定3D几何和超长证明题,但DeepMind团队已经放话:下一步要让AI直接读懂人类语言题干自动解题

到那时候,奥数考场怕是要变成AI的独角戏舞台。

论文作者Yuri Chervonyi透露:

「我们现在就像在给AI安装数学家的直觉」

当算法开始具备「几何美感」的感知能力,人类引以为傲的创造性思维还守得住吗?

这项研究来自谷歌DeepMind、剑桥大学、佐治亚理工学院和布朗大学的联合团队。有兴趣的读者可以在arXiv上查看论文全文:arxiv.org/abs/2502.03544

此刻,全球奥数教练们正集体失眠——毕竟,当AI开始用300倍速度解出金牌题,我们该教孩子什么?

背题技巧?

还是…怎么给AI 打工当助教吧?

(文:AGI Hunt)

欢迎分享

发表评论