AI Agent大战开启!OpenAI老对手Anthropic上线Harmony,内化代理功能

文丨丁灵波
国产应用Manus的一夜爆火让行业意识到用户对于通用AI Agent产品的极大期待和需求,促使一些AI领跑者纷纷加速市场竞争节奏。
作为封闭AI的代表,OpenAI在第一时间做出反应,抛出一整套构建模块帮助开发人员构建AI代理,试图推动自家的Responses API、Agents SDK成为广泛构建AI代理的基础。
今天,OpenAI的老对手,美国另一家AI独角兽Anthropic也出手了。
有开发者发现,Anthropic正在开始小范围测试一种名为Harmony功能的早期预览版,Harmony将允许用户授予Claude对本地目录的完全访问权限,以便其可以查询、研究和操作其内容,开始将各项AI Agent功能作为内化应用。

Claude模型在AI发开发者圈备受好评,因其在编码、多步骤工作流程方面性能卓越,突然走红的Manus也是使用其Claude 3.5版本作为底座模型,集成20余项开源工具开发而成。
除了AI大模型,一场在AI Agent层面的开源和封闭之争也在展开,哪个阵营的体验更好可以拭目以待。
原生AI代理将上马
Anthropic代码库的最新更新表明,Harmony将很快在功能预览设置中可用,尽管此功能尚未正式发布,但部分开发者已经有机会对其进行测试。
Harmony可以做什么?就目前的初步测试发现,它支持扫描本地目录并链接到响应中的某些文件;在侧边栏中打开并分析文件;编辑文件并显示差异以供用户批准;搜索特定关键词的用途;作为简约的IDE工作,为开发人员提供综合的工具集用于创建、测试和调试软件等。
开发者在上传Android应用程序并提示Claude进行研究时,AI代理会系统地打开并索引每个文件,然后以工件的形式生成综合摘要,它还显示上下文容量使用情况,突出显示在此过程中消耗了多少可用内存。
除了被动分析之外,Harmony还允许用户修改现有文件、保存更改,甚至直接在集成目录中创建新文件,此外,它还支持基于关键字的搜索,提供相关结果的结构化概览。
此功能有可能成为强大的AI编码助手。在测试场景中,Claude在几分钟内分析了整个代码库,并成功识别了一个项目中的10个不同的安全漏洞,如果广泛发布,这可能标志着AI辅助软件开发的又一次重大飞跃。
在AI代码辅助方面,它有望提供代码自动补全、代码优化建议、检查与错误修复、自动化单元测试生成等。
除了Harmony,Anthropic还在开发另一项名为Compass的功能,虽然细节尚不清楚,但Compass似乎可以让Claude跨多个来源进行深入研究,整合网络搜索、研究资源和结构化报告,还有Web Search,用于扩展Claude收集和分析在线信息的能力。

此外,最近更新中还提到“记忆”、“任务”和“代理”等,表明Anthropic可能正在探索类似于全面自主AI代理的功能,就像某些实验性AI项目一样,目前尚不清楚这些工具将如何集成在Claude中并发挥作用。
如果成功实施,这些新增功能会大大扩展Claude的能力边界,使其成为在编码、研究和一般生产力方面更强大的AI助手。
“标准协议”的博弈
Anthropic首席执行官Dario Amodei在最近的一次采访中提到,在未来3到6个月内,AI将编写90%的代码,我们必须用不同于以前的方式来思考有用性和无用性。

Anthropic正在布局一盘大棋,旗下的MCP开源协议在硅谷掀起了一波技术热潮,被外界称为智能体的“万能手”。
MCP是一种开放协议,它标准化了应用程序向LLM提供上下文的方式。可以将MCP视为AI应用程序的USB-C端口。正如USB-C提供了一种将设备连接到各种外围设备和配件的标准化方式一样,MCP提供了一种将AI模型连接到不同数据源和工具的标准化方式。
这是将AI助手连接到数据所在系统(包括内容存储库、业务工具和开发环境)的新标准,比OpenAI在策略和动作上都更快了一步。
随着强大的AI代理逐渐被市场所期待,业界已投入大量资金来提升模型能力,在推理和质量方面取得了快速进步。然而,即使是最复杂的模型也受到与数据隔离的限制——被困在信息孤岛和遗留系统后面,每个新数据源都需要自己的自定义实现,这使得真正互联的系统难以扩展。
MCP解决了这一挑战,它为连接AI系统和数据源提供了一个通用的开放标准,用单一协议取代了分散的集成。
作为竞争者,OpenAI通过推出Responses API和新的Agents SDK对MCP和Manus进行了反击,目标是打造闭环生态工具矩阵,通过Responses API与 Agents SDK构成工具矩阵打造 “感知-决策-执行” 全栈控制链,尽管其AI代理开发工具包非常强大,但缺点是开发者必须使用他们的LLM。
Anthropic与OpenAI协议之争被网友类比为如同当年MSFT和Apple系统之间的争夺战,在各种AI代理大爆发之前,谁能成为的统一开放标准对于未来市场竞争变得极为关键。
对于国内AI大厂而言,也是时候在AI代理的统一开放标准方面形成自己的技术优势和链条布局了,需要真正做一些行业关键卡扣技术,而不是总靠拿来主义。
需要深挖“有用性”
2025年,科技圈被AI Agent的战火点燃,一场激烈的智能体大战正在涌现,众多科技巨头和创新企业纷纷入局,试图在市场中抢占先机。
AI Agent从概念走向现实,市场咨询机构Gartner将其列为2025年十大战略技术趋势之首,据Gartner预测,到2028年,约15%的日常工作决策将由Agentic AI(智能体人工智能)自主完成,而企业软件应用程序中包含Agentic AI的比例也将飙升至33%。
另据Capgemini的报告指出,高达82%的组织计划在2026年前集成AI Agent,用于电子邮件生成、编码和数据分析等任务。
这场大战中,AI巨头凭借深厚的技术积累和庞大的资源优势,率先吹响冲锋号
Anthropic之外,OpenAI推出Responses API、内置工具和Agents SDK,也同步深挖自己的Operator功能,可独立浏览互联网、购物等,以及Deep Research功能可在十几分钟内完成人类需数小时才能完成的研究任务。
谷歌DeepMind在布局通用助手Project Astra、 浏览器自动执行Project Mariner和编程助手Jules等。
微软和OpenAI合作在Dynamics 365企业级应用套件中引入商用“AI Agent”,每一个自主代理都可以自动处理某项特定任务或工作链条,涉及企业不同业务范畴,有望替代大量人工。
在国内,除了意外走红的Manus,阿里、腾讯、百度、字节跳动、智谱等都在加紧布局各类AI Agent应用。
加上业内并行的开源和封闭不同发展路径,这场激烈的竞争在短期内可能会呈现出比移动互联网起步时更大的市场爆发力,如何把握战局和机会,正如Dario Amodei提到的那句话:需要用不同于以往的方式来思考有用性和无用性。

(文:头部科技)

欢迎分享

发表评论