新智元报道
新智元报道
【新智元导读】又爆大瓜!FrontierMath的o3惊人表现,竟是因OpenAI资助了Epoch AI而提前获得大部分试题访问权。OpenAI模型的性能究竟几分是真,几分炒作,愈来愈变得扑朔迷离。
-
我们无从得知OpenAI是否用这个评测集训练了o3,因此他们宣称的结果可信度值得质疑 -
数学家们被有意隐瞒了真相,而大多数人甚至从未怀疑过会有一家AI公司在背后提供资金支持
Epoch AI首席数学家回应
已有端倪,激起热议
左右滑动查看
-
o3-mini在ARC-AGI中的正确率为156/400 -
o3-mini在Frontiermath上的表现并不理想
(文:新智元)