重磅!Anthropic 发布新一代混合推理模型Claude 3.7 Sonnet,编程能力再上台阶

Anthropic 公司北京时间25日凌晨发布了 Claude 3.7 Sonnet,一款具备混合推理能力的大型语言模型,以及 Claude Code,一个面向开发者的智能编码助手。


Claude 3.7 Sonnet

Anthropic 公司时隔四个月终于推出了自家的新模型Claude 3.7 Sonnet,这款模型最大的创新在于其“混合推理”能力,具体特性如下:

  • 混合推理能力:

    • 这是该模型最显著的特点,它允许模型在“即时响应”和“深度思考”之间切换。
    • “深度思考”模式下,模型会进行逐步推理,并将思考过程展示给用户,提升透明度和可理解性。
  • 编码能力大幅提升:

    • 在编码和前端网页开发方面,Claude 3.7 Sonnet 表现出强大的性能。
    • 它能更好地处理复杂的代码库,并能更精确地执行高级工具的使用。
  • 灵活的思考控制:

    • 通过 API,用户可以精细控制模型的思考时间,即“思考预算”。
    • 这允许用户根据需要,在速度和答案质量之间进行权衡。
  • 实际应用导向:

  • Anthropic 强调该模型在实际商业应用中的表现,而非仅在学术基准测试中的成绩。

  • 性能卓越:

  • 在SWE-bench Verified 和TAU-bench等测试中,都取得了非常优秀的成绩。


Claude Code

为了进一步提升开发者的编码效率,Anthropic 还推出了 Claude Code,它具备了以下特点:

  • 命令行工具:
    • Claude Code 是一款命令行工具,旨在简化开发者的编码工作。
  • 智能协作:
    • 它可以搜索和阅读代码、编辑文件、编写和运行测试、提交代码到 GitHub,以及使用命令行工具。
  • 提升开发效率:
    • 通过自动化重复性任务,Claude Code 显著减少了开发时间和工作量。
    • 能够处理复杂的代码重构,debug等任务。
  • 持续改进:
    • Anthropic 计划根据用户反馈,不断改进 Claude Code 的功能和性能。
  • GitHub集成:
    • Claude.ai,现在可以和GitHub进行集成,开发者可以更方便的将代码库和Claude进行连接。


小结

该模型应该就是之前传言的4.0版本,从发布内容来看,虽然是小版本号,但诚意还是满满的,也没有像其他厂商将普通模型和推理模型分开,“混合推理”能力,避免了认知碎片。

Anthropic有自己的一个模型迭代路线图并稳步迭代,从协助个人更好的完成当前工作,到作为专家独立工作扩展用户能力边界,再到突破性的帮助完成原本一个团队以年计的挑战性工作,同时,Anthropic 非常了解自己的长处,以编程作为突破口,此次发布进一步巩固了其在编程领域的优势,它将AI编程又推向一个新高度,等Cursor、Windsurf 集成后,我们一起看看会有什么新的变化。

公众号私信“进群”入群讨论。

(文:AI工程化)

欢迎分享

发表评论