简单才是王道,这是Anthropic和数十家团队建构AI Agent的终极心得!
Anthropic刚刚发布了一篇博客,揭示了他们与众多团队合作开发AI Agent的经验。
有趣的是,最成功的实现并不依赖复杂的框架或特殊的库,而是使用简单、可组合的模式。
而且,他们还计划在2025年推出更大的动作:一个能自主操作电脑、编写代码、和同事交流的「虚拟协作者」!
工作流还是Agent?
Anthropic对「Agent」下了个有趣的定义。
在他们看来,Agent系统分两种:
-
工作流(Workflows):通过预定义的代码路径来编排LLM和工具
-
Agent:由LLM自主决定如何完成任务,动态使用工具
选哪个?这是道送命题。
Anthropic建议:先用最简单的方案。
很多时候,一个优化过的单次LLM调用就够用了。
只有在真正需要的时候才考虑Agent系统。毕竟这会增加延迟和成本,需要权衡值不值得。
常见模式大揭秘
Anthropic总结了几种经典模式:
1. 提示链(Prompt Chaining) 当任务能清晰地分解为固定子任务时,这种模式最合适。比如:先生成营销文案,再翻译成其他语言。
2. 路由(Routing) 适合处理不同类型的输入。例如:将不同类型的客服查询分流到不同的处理流程。
3. 并行化(Parallelization) 两种玩法:
-
任务分段:将大任务分解为可并行的子任务
-
投票:同一个任务运行多次,获取多样的输出
4. 调度者-工作者(Orchestrator-Workers) 中央LLM负责任务分解和结果整合,很适合复杂的编码任务。
5. 评估者-优化者(Evaluator-Optimizer) 一个LLM生成响应,另一个提供反馈,形成优化循环。
客服和编码:两大杀手级应用
Anthropic特别提到了两个实战案例:
客服领域:结合了传统聊天机器人界面和增强功能:
-
自然的对话流程
-
集成客户数据和工具
-
可编程的退款和工单更新
-
清晰的成功衡量标准
编码领域:
-
代码可通过自动化测试验证
-
Agent可以根据测试结果迭代方案
-
问题空间结构清晰
-
输出质量可客观衡量
工具设计的艺术
Anthropic强调,工具设计至关重要。他们建议:
-
为LLM提供足够的思考空间
-
保持格式接近互联网上的自然文本
-
避免复杂的格式要求
最后,Anthropic 总结到:
投入在人机界面(HCI)上的努力有多少,在代理-计算机界面(ACI)上就该投入多少。
(文:AGI Hunt)