Epoch AI归档 - 每时AI

o4-mini暴击六大数学天团，攻破陶哲轩难题！4.5h激战人类阵地失守

下午11时 2025/05/27 作者新智元

不到两年，o4-mini与40位数学家挑战300道菲尔兹奖级难题，一举击败6组团队，碾压人类平均水平。Epoch AI举办比赛考察AI数学能力进展，结果显示AI在FrontierMath上解决了约22%的题目，而人类总体上解决约35%的题目。未来1-2年内，『超级程序员』和『AI数学家』将取得重大突破。

推理大模型1年内就会撞墙，性能无法再扩展几个数量级 FrontierMath团队最新研究

下午4时 2025/05/13 作者量子位

Epoch AI指出，若推理模型保持每3-5个月以10倍速度增长，则训练所需的算力可能大幅收敛。当前最前沿的推理模型如o1和o3的推理训练规模还未见顶，但有可能在一到两年内达到上限。

速递｜AI基建2000亿美元账单，百万级芯片砌的算力或成全球电网最大威胁？

下午4时 2025/04/25 作者 Z Potentials

人工智能数据中心电力需求激增，预计到2030年耗电相当于9座核反应堆。研究显示，AI数据中心硬件成本和电力消耗在5年内每年增加1.9倍和2倍，可能需要数百万芯片、数千亿美元投资及数吉瓦电力。

满血o3降智和幻觉倍增的原因可能找到了

上午8时 2025/04/22 作者 AI寒武纪

OpenAI推出的满血版O3模型在数学基准测试中的成绩被独立测试揭穿为10%，远低于原公布的25%+，揭示了测试环境、数据集以及模型版本差异的影响。

o3被曝「无视」前成果？华人博士生实名指控，谢赛宁等大牛激烈争辩

下午4时 2025/04/21 作者新智元

人成果？一名华盛顿大学博士生发出质疑，OpenAI研究人员对此回应：不存在。
在视觉感知方面，o3和

谷歌等最新研究，合成数据可将大模型数学推理提升8倍

上午8时 2025/04/07 作者 AIGC开放社区

专注AIGC领域的专业社区分享了关于大语言模型训练数据的研究成果，指出合成数据成为替代方案，并介绍了一种优化方法用于利用负面数据提升模型性能。

全球AI算力报告出炉，LLM最爱A100！谷歌坐拥超100万H100等效算力

下午4时 2025/02/15 作者新智元

全球AI算力快速增长，2008至2024年增长超7倍。顶级硬件能效提升显著，低精度计算成为主流。英伟达、Meta等公司主导高性能GPU市场。训练大型模型所需处理器数量大幅增加。

OpenAI被爆造假！o3碾压一切的数学能力，全靠“作弊”

下午11时 2025/01/20 作者乌鸦智能说

OpenAI因在FrontierMath数学基准测试中作弊而陷入风波，被指获得了题库的特权访问权，并资助了该测试。此举引发了业界对于OpenAI领先优势是否真实存在的质疑，同时也暴露了其商业化压力下的困境。

OpenAI 最强模型被曝造假！提前获取测试题，顶级数学家被蒙在鼓里

下午4时 2025/01/20 作者 APPSO

近日，OpenAI在FrontierMath数学基准测试中成绩突飞猛进，但承包商爆料称其获得了不公平的特权访问权，引发争议。

o3被曝成绩「造假」，60多位数学泰斗集体被耍！OpenAI暗中操控，考卷提前看光

下午12时 2025/01/20 作者新智元

FrontierMath数学基准测试中o3模型表现优异，但因OpenAI资助和数据访问权引发质疑。Epoch AI与OpenAI合作未公开资金来源，导致数学家蒙在鼓里。Epoch AI及Tamay Besiroglu表示将提高透明度。