逻辑缺陷归档 - 每时AI

2025美国最新奥数题，让大模型集体翻车，DeepSeek R1平均分也不到5%

2025年4月2日23时作者机器之心

日子吗？
当你在凌晨三点对着一道几何证明题抓耳挠腮、怀疑人生的时候，你可能会想：「要是有个超级大脑能

美国奥数题撕碎AI数学神话，顶级模型现场翻车！最高得分5%，DeepSeek唯一逆袭

2025年4月2日11时作者新智元

：在美国数学奥赛，顶级AI模型得分不足5%！来自ETH Zurich等机构的MathArena团队，