OpenAI或于今晚推出o3-pro

Pro用户的账号里突然出现了o3-pro!

开发者@legit_api在自己的Plus账户里发现了这个本不该存在的选项,虽然很快就消失了,但这个短暂的「意外」却引发了社区的热烈讨论。

有意思的是,这不是个例。

多位用户报告了类似的异常现象。

神秘模型现身

此前,航空航天工程专业的Max 就已最先注意到了「o1 pro」的异常表现。

他发现这个模型表现出了几个奇怪的特征:

它坚称自己是o3,还能访问memory工具,可以进行网络搜索。

最诡异的是,它使用的是英式拼写「optimised」而不是美式的「optimized」——而这恰恰是o3模型的特征之一。

为了验证模型是否真的在进行网络搜索,Max特意关闭了保存的记忆功能,确保它不是从其他聊天中获取上下文。

测试结果显示,这个模型的格式输出非常奇特,让人难以判断它是否只是在模拟网站内容。

思考时间异常漫长

多位用户注意到了一个共同点:这个神秘模型的思考时间异常漫长

Max进行了多次测试,当他询问模型身份时,o3平均需要15秒回答,而这个神秘模型却需要约90秒。

用户Charli也遇到了同样的情况,模型思考了1分43秒才回答自己是谁,还显示了「examining previous interactions」的提示。

Kiko H. de Mello也表示:

「我今天真的觉得o1-pro变聪明了,而且它思考了非常长的时间。」

社区猜测纷纷

面对这些异常现象,AI 社区的猜测也是五花八门。

研究员「Brian」认为这并非o3-pro,而是OpenAI在实时环境中批量测试集成功能的预发布准备。

但Max反驳说,考虑到思考时间的差异,这很可能就是o3-pro。

Tam Nguyen提出了一个大胆而幽默的猜测:「o1 pro就是o3,而o3 pro可能是o4?

更有趣的是用户Austin的发现,模型在回答过程中突然开始更新自己的简历找工作,让人哭笑不得。

内部人士暗示

来自OpenAI和微软的高级软件工程师@idontexist_nn发了个意味深长的GIF,并评论道:「我可以说我们搞坏了什么东西,但很快就会修复。」

当Charli 追问时,他又打了个嘘的表情,似乎暗示不能透露过多……

不过最为重要的信号,或许来自Sam Altman 的暗示:

o3风格引发争议

在讨论中,Anthony Ronning表达了对o3输出风格的不满:

「我已经受够了这些o3表格…o1-pro万岁!」

他认为o3那种表格化的输出格式「大多数时候完全没必要」,虽然信息密度高,视觉结构有助于处理信息,但并非所有场景都需要这种形式。

一些细节

用户Stephen提到,o1pro 对ChatGPT个性化设置非常敏感,他在运行时会关闭所有个性化功能。

Max 确认即使关闭了个性化设置,仍然观察到了相同的行为。

TjKlug猜测OpenAI可能因为成本差异而悄悄替换了模型,但Lumis指出当前的「o1 pro」思考时间比o3长得多,这可能意味着它使用了o1 pro的推理循环次数,实际上可能就是某种形式的o3 pro。

随着夏天(南半球)的到来,Prashant开玩笑说:「o3 pro随时可能发布,毕竟夏天来了。」

这次「意外泄露」究竟是OpenAI的测试失误,还是有意为之的预热?

毕竟,Sam Altman 的套路大家都有些熟悉了……

或许,o3-pro的正式发布就在今晚?

(文:AGI Hunt)

发表评论

×

下载每时AI手机APP

 

和大家一起交流AI最新资讯!

立即前往