OpenAI 陷造假风波!o3 提前看过了FrontierMath数据?

OpenAI再次陷入信任危机!

有人披露,OpenAI从一开始就能访问FrontierMath的全部数据,这让整个业界哗然。

这意味着什么?

数据对于AI公司来说就像黄金一样珍贵,但在这个「数据为王」的时代,某些巨头的行为却让人不禁担忧。

Penn大学的Delip Rao教授直指要害:「这绝对疯狂!任何了解机器学习的人都会告诉你,即使不在训练集中显式使用数据,模型也可能被污染」。

更让人惊讶的是,EpochAI的首席数学家随后透露,他们的测试集竟然还「在开发中」!

而OpenAI方面则表示,他们与FrontierMath有「口头协议」,承诺不会在模型训练中使用这些数据。

但这个解释显然无法让人信服。

正如研究员Adeola指出:「如果一个人已经多次被证实说谎,那我们为什么还要相信他们这次的承诺?」

更有意思的是,OpenAI的这一行为还与其章程相矛盾。因为这里不涉及安全或保密问题,按理说相关信息应该公开。

事态继续发酵。

有研究人员发现了更多令人不安的细节:

对此,业内人士纷纷表态:

Adam Adamowski(@argus96_adam)表示这让他想起了之前的一个案例:

OpenAI在一次考试中声称取得了70%以上的成绩,但实际上这只是补考学生中的排名,真实成绩其实只有30%左右。

研究员blueblimp(@blueblimp)则指出:

就算他们不用这些数据来「训练」,难道不会用来「评估」吗?否则为什么要获取这些数据?

这一事件也引发了更广泛的讨论。

Denton Rosegood(@DentonRosegoood)提出了一个尖锐的问题:

如果Sam Altman在这种事情上都不够诚实,我们凭什么相信他关于「通用人工智能」的预测?

Aman(@inceptmyth)则指出:

「公开披露数据源的时代已经过去了。在这场竞争中,除非你能机械地反向工程大语言模型,否则根本无法知道数据的真实来源。」

在人工智能领域,透明度和诚信同样重要。

而OpenAI,似乎正在背弃这些最为重要的东西。

(文:AGI Hunt)

欢迎分享

发表评论