Anthropic发布Claude 4:工程师级AI,而不是更聪明的搜索框或对话机器人

作者|沐风

来源AI先锋官


“我们相信,AI 不只是一个更聪明的搜索框,它应该成为理解我们、与我们并肩工作的协作伙伴。”2025年Code with Claude开发者大会上,Anthropic 联合创始人Dario Amodei 说。


这场大会是Anthropic历史上的首次开发者专场发布会。


但其所展示的内容,远非简单产品升级,而更像是在宣布:Claude 正式进入全链条开发力、部署力和标准构建的全新竞争时代。


这与一天前Google I/O大会展现的产品生态差异明显,Anthropic在探索不同的AI之路。


关联阅读:Google I/O 2025:用AI重做了所有产品,从工具进化为“行动者”



Claude Opus 4:最强通用模型,及更安全可信的AI生态


此次大会最受关注的是旗舰模型Claude Opus 4。


它延续了Claude一贯偏重推理、代码、复杂任务能力的方向,卫冕全球最佳编程模型。


Claude Opus 4 的编码能力在 SWE-bench(72.5%)和 Terminal-bench(43.2%)上大幅领先其他模型。


而且,它在需要集中精力和数千步操作的长时间任务中,表现出持续稳定的性能,能够连续工作数小时。这个对于Agent产品非常重要。


在一项测试中,Claude 4 Opus 能够自主运行《精灵宝可梦 红版》长达 24 小时,远超前代模型的 45 分钟,展示了其在复杂任务中的持续性和自主性。


在与客户Rakuten 的测试中,Claude 4 Opus 能够连续编写代码近 7 小时,显著优于前代模型 Claude 3.7 Sonnet 的 45 分钟表现。



其他的基准测试,两者的能力也都有大幅提升:


另外Claude Opus 4 在记忆能力上也显著超越了之前的所有模型。当开发者构建提供 Claude 本地文件访问的应用程序时,Opus 4 能够熟练地创建和维护”记忆文件”来存储关键信息。


与此相比,作为中端版本,Claude 4 Sonnet在推理、编码和精度方面均有提升,且成本效益更高。在长时间任务中,则能够更好地保留关键信息,尤其在获得本地文件访问权限时表现更佳。新功能上,引入包括“思维摘要”,可提供更清晰的推理过程,以及测试版的“扩展思维”模式,用于优化推理与工具使用之间的平衡。

价格上,此次Claude Sonnet 4 宣布向免费用户开放,慷慨!

API定价上,与之前的Opus和Sonnet模型一样:Opus 4每百万 token 输入/输出价格为15/75 美元,Sonnet 4为 3/15 美元。

此外,在模型安全评估方面,Claude Opus 4 达到 ASL-3 级别,是目前业内已公开模型中最高级别(Anthropic 内部标准)。这里面包括增强的网络安全措施、防止越狱的机制、有害查询的提示分类器,以及漏洞赏金计划。

结合其最早提出的“宪法式 AI”(通过预定义规则约束模型输出),可见Anthropic 正在构建一套可控、可信的AI生态系统。

这一理念,将尤其受到金融、医疗、公共机构等高合规行业的青睐,而不是仅仅针对普通to c用户的使用体验。

相比而言,ChatGPT 更像是“面向所有人”的助手,Gemini 更关注多模态视觉AI 方向。


Claude Code:从 Copilot 到“代码搭档”的飞跃

另一个重磅产品是Claude Code。

它不是一个插件,而是一个完整IDE 交互式环境中的 AI 开发助手。

它可以理解文件结构、定位bug、生成测试,并可自动执行Shell命令甚至Git操作。

和GitHub Copilot相比,Claude Code更强调“任务流程中的交互推理”,而非自动补全的速度。

Anthropic的定位很清楚:这是为专业开发者准备的工具,可以胜任真实的项目协同,而不仅仅是写点函数或注释。

更关键的是,Claude Code可在Amazon Bedrock与 Google Vertex AI 上运行,这为大型企业部署提供了灵活选项。

GitHub在刚刚的Build 2025宣布,新的Copilot Coding Agent默认调用Sonnet 4,并公开称赞其在“Agentic 场景”里的表现。

这标志GitHub 不再把 OpenAI 模型当唯一基石,更证明了Claude 4 系列的实力有多么可怕。


Anthropic的不同路径

这次发布的产品很明确地指出了Anthropic 的方向:做深层任务的AI伙伴,而不是更聪明的搜索框或“内容写手”。

Anthropic更像是为企业开发者准备的一位虚拟工程师,而不是为普通用户准备的写稿机器人。

AI 从写作助手走向协作搭档,这中间有一道质的坎。Claude 4 可能是目前唯一真正“跨过去”的模型之一。

而这只是Claude 系列的“下一章”。

从构建模型、工具链到标准协议,Anthropic 正把 Claude 从一个对话模型,升级为一个更安全可信,及提供效率的AI平台。

这显然与OpenAI、Google走了不同的路径。它将如何影响或改变AI生态,值得关注。

 

(文:AI先锋官)

发表评论

×

下载每时AI手机APP

 

和大家一起交流AI最新资讯!

立即前往