跳至内容
1. One model, two ways to think,一种模型,两种思考方式。
Claude 3.7 是首个结合一般大语言模型和推理模型功能的混合推理模型。标准模式提供快速响应,扩展思考模式实现逐步推理。
正如人类使用同一大脑既能快速反应又能深入思考,Anthropic 认为推理能力应是前沿模型的内在特质,而非完全独立于外的单独模型。
当下一些推理的模型思考过程是过度的。考虑到不同场景下速度、成本和精确度的不同需求,开发者可以设置一个“thinking budget”,来控制模型思考的上限。
3. 在编码、Tool Use 领域一如既往的优秀。
多方位性能超过 OpenAI o3-mini、DeepSeek R1 和 Grok 3 Beta。
Claude 3.7 可以说是当下最适合做写代码,以及做 Agent 的模型。
4. An Agentic Coding Tool — Claude Code
估计是看到 Cursor、Winsurf 都赚大钱了,也想探索下这方面的商业化。
5. 3.7 已经全量上线可以体验了,如果你的 Claude 付费账户没有被封禁的话。
不过 Cursor、Monica 等应该也会马上接入。
下面是一个基于 extended thinking mode 向用户解释三门问题的示例。
2025 的对应了 OpenAI 所说的 L3 智能体(不仅可以思考,还能采取行动的 AI 系统),2027 的相当于 L5 组织者(可以完成组织工作的 AI)。
(文:特工宇宙)