喜欢 Claude 的小伙伴有福了!
根据科技媒体 The Information 的报道,Anthropic 即将推出一款混合 AI 模型,这个代号未公开的新模型整合了传统大语言模型与深度推理能力,通过 “滑动比例(sliding scale)” 功能,允许开发者动态调整计算资源分配。

怎么理解这个“混合”模型呢?和我在《官宣!GPT-4.5和GPT-5细节曝光,OpenAI要放大招了!》一文中介绍的一样,OpenAI 计划跳过 o3
,直接发布整合了通用模型 GPT-4.5
和推理模型 o3
的 GPT-5
。Anthropic 即将发布的这个“混合”模型也是这个意思。
更直接一点,可以类比 混合动力车(Hybrid) 来理解。油电混合车结合了燃油发动机和电机的双重优势,可以在低速时使用电力驱动,提高能源效率;而在高速或需要更强动力时切换到燃油模式,以增强续航和性能。

Anthropic 自从去年6月20日发布 Claude 3.5 Sonnet
后就没有发布过新模型了,最多是在现有模型上做优化。本次爆料的新模型有着以下三个方面的优化。

-
动态模型切换:模型能在“快速响应”和“深度推理”模式间无缝切换。面对复杂编程任务时,可以调用更多计算资源进行长链推理,处理简单任务则保持常规模型的高效性。
-
精细化成本控制:通过可视化滑块调节推理强度(0-100%),相比 OpenAI 固定的低/中/高三档设置,提供更灵活的算力成本优化方案。
-
编程能力突破:在复杂代码库分析场景中,该模型首轮生成可运行代码的成功率超过 OpenAI
o3-mini-high
模型,尤其在处理数千文件量级的企业级代码库时表现突出。(这一点不必多说,Claude 模型的代码能力一直以来是TOP级别的)
无独有偶,国外 AI “御三家” 中的另外一家:谷歌 Gemini,近期也表达了对这种“混合”模型的支持。
谷歌 AI Studio 产品负责人 Logan Kilpatrick 曾在 OpenAI CEO Sam Altman 的关于 “OpenAI 最新技术路线” 的帖子下留言:“不错!这(混合模型)一直是我们的计划,确保推理能力是基础模型的一部分,而不该是附带任务,因此才有了 2.0 Flash Thinking 模型。”(Nice! This has always been our plan with Gemini, make sure the reasoning capabilities are part of the base model, not a side quest (hence doing 2.0 Flash Thinking). )

结语
Anthropic 你赶紧发布新模型吧,大家都等着呢!
我是木易,一个专注AI领域的技术产品经理,国内Top2本科+美国Top10 CS硕士。
相信AI是普通人的“外挂”,致力于分享AI全维度知识。这里有最新的AI科普、工具测评、效率秘籍与行业洞察。
欢迎关注“AI信息Gap”,用AI为你的未来加速。
(文:AI信息Gap)