OpenAI与Anthropic秘密开启了递归自我改进行动~

OpenAI 为什么在短短三个月内从 o1 跃升至 o3?
OpenAI GPT-5为什么迟迟未发布?
Anthropic的Claude Opus 3.5为什么没有发布?
背后的原因是:OpenAI与Anthropic秘密开启了递归自我改进(recursively self-improving)行动~,
这篇文章详细分析了OpenAI与Anthropic的模型迭代发布的逻辑:
  • OpenAI可能已经开发出GPT-5,但选择将其内部保留,而非像以往一样广泛发布。
  • GPT-5等基础模型可能仅在内部作为“教师”模型存在,通过蒸馏技术赋能其他模型,比如o1、o3,而不一定作为产品发布。
  • 像o1这样的模型的大部分意义不在于部署它,而是为了生成下一个模型的训练数据。o1解决的每一个问题现在都是o3的一个训练数据点。

  • Anthropic可能也采用了类似的方法,Opus 3.5并没有‘失败’,他们只是选择将其保留私用,并将其蒸馏成一个小型、廉价但出奇聪明的Claude-3.6-sonnet。
同时,Gwern也发表了类似观点:
  • OpenAI已经达到了“递归自我改进”的门槛,“o4或o5将能够自动化人工智能研发并完成剩余的工作。”

  • o1的主要目的是为像o3这样的模型生成合成数据,这就是为什么他对于o1-pro的发布感到惊讶的原因。

  • 他认为Anthropic的Opus 3.5没有发布的原因也是如此,计算资源被需要用来生成合成数据。
https://www.thealgorithmicbridge.com/p/this-rumor-about-gpt-5-changes-everythinghttps://x.com/kimmonismus/status/1879961110507581839

(文:PaperAgent)

欢迎分享

发表评论