OpenAI再次陷入信任危机!
有人披露,OpenAI从一开始就能访问FrontierMath的全部数据,这让整个业界哗然。
这意味着什么?
数据对于AI公司来说就像黄金一样珍贵,但在这个「数据为王」的时代,某些巨头的行为却让人不禁担忧。
Penn大学的Delip Rao教授直指要害:「这绝对疯狂!任何了解机器学习的人都会告诉你,即使不在训练集中显式使用数据,模型也可能被污染」。
更让人惊讶的是,EpochAI的首席数学家随后透露,他们的测试集竟然还「在开发中」!
而OpenAI方面则表示,他们与FrontierMath有「口头协议」,承诺不会在模型训练中使用这些数据。
但这个解释显然无法让人信服。
正如研究员Adeola指出:「如果一个人已经多次被证实说谎,那我们为什么还要相信他们这次的承诺?」
更有意思的是,OpenAI的这一行为还与其章程相矛盾。因为这里不涉及安全或保密问题,按理说相关信息应该公开。
事态继续发酵。
有研究人员发现了更多令人不安的细节:
对此,业内人士纷纷表态:
Adam Adamowski(@argus96_adam)表示这让他想起了之前的一个案例:
OpenAI在一次考试中声称取得了70%以上的成绩,但实际上这只是补考学生中的排名,真实成绩其实只有30%左右。
研究员blueblimp(@blueblimp)则指出:
就算他们不用这些数据来「训练」,难道不会用来「评估」吗?否则为什么要获取这些数据?
这一事件也引发了更广泛的讨论。
Denton Rosegood(@DentonRosegoood)提出了一个尖锐的问题:
如果Sam Altman在这种事情上都不够诚实,我们凭什么相信他关于「通用人工智能」的预测?
Aman(@inceptmyth)则指出:
「公开披露数据源的时代已经过去了。在这场竞争中,除非你能机械地反向工程大语言模型,否则根本无法知道数据的真实来源。」
在人工智能领域,透明度和诚信同样重要。
而OpenAI,似乎正在背弃这些最为重要的东西。
(文:AGI Hunt)