Pro用户的账号里突然出现了o3-pro!

开发者@legit_api在自己的Plus账户里发现了这个本不该存在的选项,虽然很快就消失了,但这个短暂的「意外」却引发了社区的热烈讨论。
有意思的是,这不是个例。
多位用户报告了类似的异常现象。
神秘模型现身
此前,航空航天工程专业的Max 就已最先注意到了「o1 pro」的异常表现。
他发现这个模型表现出了几个奇怪的特征:
它坚称自己是o3,还能访问memory工具,可以进行网络搜索。
最诡异的是,它使用的是英式拼写「optimised」而不是美式的「optimized」——而这恰恰是o3模型的特征之一。



为了验证模型是否真的在进行网络搜索,Max特意关闭了保存的记忆功能,确保它不是从其他聊天中获取上下文。

测试结果显示,这个模型的格式输出非常奇特,让人难以判断它是否只是在模拟网站内容。
思考时间异常漫长
多位用户注意到了一个共同点:这个神秘模型的思考时间异常漫长。

Max进行了多次测试,当他询问模型身份时,o3平均需要15秒回答,而这个神秘模型却需要约90秒。
用户Charli也遇到了同样的情况,模型思考了1分43秒才回答自己是谁,还显示了「examining previous interactions」的提示。
Kiko H. de Mello也表示:
「我今天真的觉得o1-pro变聪明了,而且它思考了非常长的时间。」
社区猜测纷纷
面对这些异常现象,AI 社区的猜测也是五花八门。
研究员「Brian」认为这并非o3-pro,而是OpenAI在实时环境中批量测试集成功能的预发布准备。
但Max反驳说,考虑到思考时间的差异,这很可能就是o3-pro。

Tam Nguyen提出了一个大胆而幽默的猜测:「o1 pro就是o3,而o3 pro可能是o4?」

更有趣的是用户Austin的发现,模型在回答过程中突然开始更新自己的简历找工作,让人哭笑不得。
内部人士暗示
来自OpenAI和微软的高级软件工程师@idontexist_nn发了个意味深长的GIF,并评论道:「我可以说我们搞坏了什么东西,但很快就会修复。」

当Charli 追问时,他又打了个嘘的表情,似乎暗示不能透露过多……
不过最为重要的信号,或许来自Sam Altman 的暗示:

o3风格引发争议
在讨论中,Anthony Ronning表达了对o3输出风格的不满:
「我已经受够了这些o3表格…o1-pro万岁!」

他认为o3那种表格化的输出格式「大多数时候完全没必要」,虽然信息密度高,视觉结构有助于处理信息,但并非所有场景都需要这种形式。
一些细节
用户Stephen提到,o1pro 对ChatGPT个性化设置非常敏感,他在运行时会关闭所有个性化功能。
Max 确认即使关闭了个性化设置,仍然观察到了相同的行为。
TjKlug猜测OpenAI可能因为成本差异而悄悄替换了模型,但Lumis指出当前的「o1 pro」思考时间比o3长得多,这可能意味着它使用了o1 pro的推理循环次数,实际上可能就是某种形式的o3 pro。
随着夏天(南半球)的到来,Prashant开玩笑说:「o3 pro随时可能发布,毕竟夏天来了。」
这次「意外泄露」究竟是OpenAI的测试失误,还是有意为之的预热?
毕竟,Sam Altman 的套路大家都有些熟悉了……
或许,o3-pro的正式发布就在今晚?
(文:AGI Hunt)