Anthropic 公司北京时间25日凌晨发布了 Claude 3.7 Sonnet,一款具备混合推理能力的大型语言模型,以及 Claude Code,一个面向开发者的智能编码助手。
Claude 3.7 Sonnet
Anthropic 公司时隔四个月终于推出了自家的新模型Claude 3.7 Sonnet,这款模型最大的创新在于其“混合推理”能力,具体特性如下:
-
混合推理能力:
-
这是该模型最显著的特点,它允许模型在“即时响应”和“深度思考”之间切换。 -
“深度思考”模式下,模型会进行逐步推理,并将思考过程展示给用户,提升透明度和可理解性。 -
编码能力大幅提升:
-
在编码和前端网页开发方面,Claude 3.7 Sonnet 表现出强大的性能。 -
它能更好地处理复杂的代码库,并能更精确地执行高级工具的使用。 -
灵活的思考控制:
-
通过 API,用户可以精细控制模型的思考时间,即“思考预算”。 -
这允许用户根据需要,在速度和答案质量之间进行权衡。 -
实际应用导向:
-
Anthropic 强调该模型在实际商业应用中的表现,而非仅在学术基准测试中的成绩。
-
性能卓越:
-
在SWE-bench Verified 和TAU-bench等测试中,都取得了非常优秀的成绩。
Claude Code
为了进一步提升开发者的编码效率,Anthropic 还推出了 Claude Code,它具备了以下特点:
-
命令行工具: -
Claude Code 是一款命令行工具,旨在简化开发者的编码工作。 -
智能协作: -
它可以搜索和阅读代码、编辑文件、编写和运行测试、提交代码到 GitHub,以及使用命令行工具。 -
提升开发效率: -
通过自动化重复性任务,Claude Code 显著减少了开发时间和工作量。 -
能够处理复杂的代码重构,debug等任务。 -
持续改进: -
Anthropic 计划根据用户反馈,不断改进 Claude Code 的功能和性能。 -
GitHub集成: -
Claude.ai,现在可以和GitHub进行集成,开发者可以更方便的将代码库和Claude进行连接。
小结
该模型应该就是之前传言的4.0版本,从发布内容来看,虽然是小版本号,但诚意还是满满的,也没有像其他厂商将普通模型和推理模型分开,“混合推理”能力,避免了认知碎片。
Anthropic有自己的一个模型迭代路线图并稳步迭代,从协助个人更好的完成当前工作,到作为专家独立工作扩展用户能力边界,再到突破性的帮助完成原本一个团队以年计的挑战性工作,同时,Anthropic 非常了解自己的长处,以编程作为突破口,此次发布进一步巩固了其在编程领域的优势,它将AI编程又推向一个新高度,等Cursor、Windsurf 集成后,我们一起看看会有什么新的变化。
公众号私信“进群”入群讨论。
(文:AI工程化)