OpenAI 陷造假风波！o3 提前看过了FrontierMath数据？

OpenAI再次陷入信任危机！

有人披露，OpenAI从一开始就能访问FrontierMath的全部数据，这让整个业界哗然。

这意味着什么？

数据对于AI公司来说就像黄金一样珍贵，但在这个「数据为王」的时代，某些巨头的行为却让人不禁担忧。

Penn大学的Delip Rao教授直指要害：「这绝对疯狂！任何了解机器学习的人都会告诉你，即使不在训练集中显式使用数据，模型也可能被污染」。

更让人惊讶的是，EpochAI的首席数学家随后透露，他们的测试集竟然还「在开发中」！

而OpenAI方面则表示，他们与FrontierMath有「口头协议」，承诺不会在模型训练中使用这些数据。

但这个解释显然无法让人信服。

正如研究员Adeola指出：「如果一个人已经多次被证实说谎，那我们为什么还要相信他们这次的承诺？」

更有意思的是，OpenAI的这一行为还与其章程相矛盾。因为这里不涉及安全或保密问题，按理说相关信息应该公开。

事态继续发酵。

有研究人员发现了更多令人不安的细节：

对此，业内人士纷纷表态：

Adam Adamowski(@argus96_adam)表示这让他想起了之前的一个案例：

OpenAI在一次考试中声称取得了70%以上的成绩，但实际上这只是补考学生中的排名，真实成绩其实只有30%左右。

研究员blueblimp(@blueblimp)则指出：

就算他们不用这些数据来「训练」，难道不会用来「评估」吗？否则为什么要获取这些数据？

这一事件也引发了更广泛的讨论。

Denton Rosegood(@DentonRosegoood)提出了一个尖锐的问题：

如果Sam Altman在这种事情上都不够诚实，我们凭什么相信他关于「通用人工智能」的预测？

Aman(@inceptmyth)则指出：

「公开披露数据源的时代已经过去了。在这场竞争中，除非你能机械地反向工程大语言模型，否则根本无法知道数据的真实来源。」

在人工智能领域，透明度和诚信同样重要。

而OpenAI，似乎正在背弃这些最为重要的东西。

（文：AGI Hunt）