Claude 3.7 Sonnet & Claude Code 今日发布

直讲重点
1. One model, two ways to think,一种模型,两种思考方式。
Claude 3.7 是首个结合一般大语言模型和推理模型功能的混合推理模型。标准模式提供快速响应,扩展思考模式实现逐步推理。
正如人类使用同一大脑既能快速反应又能深入思考,Anthropic 认为推理能力应是前沿模型的内在特质,而非完全独立于外的单独模型。
2. 通过 API 访问可以控制模型思考时长。
当下一些推理的模型思考过程是过度的。考虑到不同场景下速度、成本和精确度的不同需求,开发者可以设置一个“thinking budget”,来控制模型思考的上限。
3. 在编码、Tool Use 领域一如既往的优秀。
多方位性能超过 OpenAI o3-mini、DeepSeek R1 和 Grok 3 Beta。
Claude 3.7 可以说是当下最适合做写代码,以及做 Agent 的模型。
4. An Agentic Coding Tool — Claude Code
估计是看到 Cursor、Winsurf 都赚大钱了,也想探索下这方面的商业化。
具体演示如下:
5. 3.7 已经全量上线可以体验了,如果你的 Claude 付费账户没有被封禁的话。
不过 Cursor、Monica 等应该也会马上接入。
下面是一个基于 extended thinking mode 向用户解释三门问题的示例。
6. 发展规划
2025 的对应了 OpenAI 所说的 L3 智能体(不仅可以思考,还能采取行动的 AI 系统),2027 的相当于 L5 组织者(可以完成组织工作的 AI)。

(文:特工宇宙)

欢迎分享

发表评论