Datawhale分享

OpenAI：思维链，整理：Datawhale

信息来源｜新智元

今天凌晨，OpenAI 为 ChatGPT 推出了一系列更新，其中一项重要改进是允许用户更深入地查看 o3-mini 和 o3-mini-high 模型的思维链内容。

比如问「怎么今天不是星期五啊😅」？

在展示出来的CoT中，o3-mini一步步思考，这个问题应该是用户在搞幽默，觉得本周应该快结束了，结果还没结束。因此，自己需要给一个聪明机智的回答。

然后它用Zeller公式计算后发现，2025年2月6日的确是星期四，即使闰年的特殊情况也是如此。

最终，它回答说：今天的确是周四不是周五，日历就是这么定的。然后提供了一番情绪价值，鼓励用户说：再忍忍，只差一天啦！

不过，机智的大神们很快就发现了「华点」——这是「真的CoT」吗？

没多久，就破案了！

先是OpenAI研究员Noam Brown发文表示，这次放出来的并不是模型原始的CoT。

随后，Tibor Blaho也发现——所谓的CoT，无非就是个「总结器」而已。（手动狗头）

对此，奥特曼解释道，我们正努力整理原始的CoT提升可读性，并在必要时提供翻译，尽量保持原始内容的忠实度。

他放出了四个emoji，让o3-mini在思维链中展示了一把推理过程

部分开放的原因

OpenAI这波植入CoT总结器的做法，着实是被DeepSeek R1强势崛起吓到了。

o3-mini发布当天，OpenAI在Reddit开启AMA在线问答中，网友曾提问，「我们能看到模型思考的所有token吗」？

当时，奥特曼回复道，「我们很快就会展示一个更有帮助、更详细的版本」。

仅仅在不到一周的今天，OpenAI就更新了。

但这次，OpenAI之所以选择展示总结版本，而不是完整的思维链，部分原因还是竞争。该公司表示其找到了一个平衡：o3-mini可以「自由思考」，然后将其「思维」组织成某个总结版本。

对此，OpenAI发言人表示，「为了提高清晰度和安全性，我们增加了一个额外的后处理步骤，其中模型审查原始思维链，移除任何不安全的内容，然后简化任何复杂的思想。」

「此外，这个后处理步骤使非英语用户能够以他们的母语接收思维链，创造一个更易于访问和友好的体验。」

参考资料：

https://x.com/btibor91/status/1887633671483760862

https://x.com/OpenAI/status/1887616278661112259

https://x.com/polynoamial/status/1887621287616651429

（文：Datawhale）