Anthropic发布Claude 4：工程师级AI，而不是更聪明的搜索框或对话机器人

作者｜沐风

来源｜AI先锋官

“我们相信，AI 不只是一个更聪明的搜索框，它应该成为理解我们、与我们并肩工作的协作伙伴。”2025年Code with Claude开发者大会上，Anthropic 联合创始人Dario Amodei 说。

这场大会是Anthropic历史上的首次开发者专场发布会。

但其所展示的内容，远非简单产品升级，而更像是在宣布：Claude 正式进入全链条开发力、部署力和标准构建的全新竞争时代。

这与一天前Google I/O大会展现的产品生态差异明显，Anthropic在探索不同的AI之路。

关联阅读：Google I/O 2025：用AI重做了所有产品，从工具进化为“行动者”

Claude Opus 4：最强通用模型，及更安全可信的AI生态

此次大会最受关注的是旗舰模型Claude Opus 4。

它延续了Claude一贯偏重推理、代码、复杂任务能力的方向，卫冕全球最佳编程模型。

Claude Opus 4 的编码能力在 SWE-bench（72.5%）和 Terminal-bench（43.2%）上大幅领先其他模型。

而且，它在需要集中精力和数千步操作的长时间任务中，表现出持续稳定的性能，能够连续工作数小时。这个对于Agent产品非常重要。

在一项测试中，Claude 4 Opus 能够自主运行《精灵宝可梦红版》长达 24 小时，远超前代模型的 45 分钟，展示了其在复杂任务中的持续性和自主性。

在与客户Rakuten 的测试中，Claude 4 Opus 能够连续编写代码近 7 小时，显著优于前代模型 Claude 3.7 Sonnet 的 45 分钟表现。

其他的基准测试，两者的能力也都有大幅提升：

另外Claude Opus 4 在记忆能力上也显著超越了之前的所有模型。当开发者构建提供 Claude 本地文件访问的应用程序时，Opus 4 能够熟练地创建和维护”记忆文件”来存储关键信息。

与此相比，作为中端版本，Claude 4 Sonnet在推理、编码和精度方面均有提升，且成本效益更高。在长时间任务中，则能够更好地保留关键信息，尤其在获得本地文件访问权限时表现更佳。新功能上，引入包括“思维摘要”，可提供更清晰的推理过程，以及测试版的“扩展思维”模式，用于优化推理与工具使用之间的平衡。

价格上，此次Claude Sonnet 4 宣布向免费用户开放，慷慨！

API定价上，与之前的Opus和Sonnet模型一样：Opus 4每百万 token 输入/输出价格为15/75 美元，Sonnet 4为 3/15 美元。

此外，在模型安全评估方面，Claude Opus 4 达到 ASL-3 级别，是目前业内已公开模型中最高级别（Anthropic 内部标准）。这里面包括增强的网络安全措施、防止越狱的机制、有害查询的提示分类器，以及漏洞赏金计划。

结合其最早提出的“宪法式 AI”（通过预定义规则约束模型输出），可见Anthropic 正在构建一套可控、可信的AI生态系统。

这一理念，将尤其受到金融、医疗、公共机构等高合规行业的青睐，而不是仅仅针对普通to c用户的使用体验。

相比而言，ChatGPT 更像是“面向所有人”的助手，Gemini 更关注多模态视觉AI 方向。

Claude Code：从 Copilot 到“代码搭档”的飞跃

另一个重磅产品是Claude Code。

它不是一个插件，而是一个完整IDE 交互式环境中的 AI 开发助手。

它可以理解文件结构、定位bug、生成测试，并可自动执行Shell命令甚至Git操作。

和GitHub Copilot相比，Claude Code更强调“任务流程中的交互推理”，而非自动补全的速度。

Anthropic的定位很清楚：这是为专业开发者准备的工具，可以胜任真实的项目协同，而不仅仅是写点函数或注释。

更关键的是，Claude Code可在Amazon Bedrock与 Google Vertex AI 上运行，这为大型企业部署提供了灵活选项。

GitHub在刚刚的Build 2025宣布，新的Copilot Coding Agent默认调用Sonnet 4，并公开称赞其在“Agentic 场景”里的表现。

这标志GitHub 不再把 OpenAI 模型当唯一基石，更证明了Claude 4 系列的实力有多么可怕。

Anthropic的不同路径

这次发布的产品很明确地指出了Anthropic 的方向：做深层任务的AI伙伴，而不是更聪明的搜索框或“内容写手”。

Anthropic更像是为企业开发者准备的一位虚拟工程师，而不是为普通用户准备的写稿机器人。

AI 从写作助手走向协作搭档，这中间有一道质的坎。Claude 4 可能是目前唯一真正“跨过去”的模型之一。

而这只是Claude 系列的“下一章”。

从构建模型、工具链到标准协议，Anthropic 正把 Claude 从一个对话模型，升级为一个更安全可信，及提供效率的AI平台。

这显然与OpenAI、Google走了不同的路径。它将如何影响或改变AI生态，值得关注。

（文：AI先锋官）

一	二	三	四	五	六	日
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31

发表评论 取消回复

下载每时AI手机APP

发表评论取消回复