文章来源: https://www.philschmid.de/single-vs-multi-agents
发布时间: 2025年6月20日
本文作者:Google DeepMind的AI 开发体验专家Philipp Schmid
关于在AI社区中构建智能体的正确方式的争论,因为Cognition的「不要构建多智能体」和Anthropic的「我们如何构建多智能体研究系统」而变得激烈。尽管标题截然相反,但两者的观点却出奇地一致。
选择单智能体还是多智能体系统并不是意识形态问题,而是为正确的工作选择正确的工具。
在深入了解之前,让我们建立一个简单的定义。
AI 智能体是一个使用大型语言模型(LLM)作为推理引擎来决定应用程序控制流的系统。
什么是单智能体?
单智能体系统作为「单一进程」运行。可以把它想象成一个高度专注的工作者,从头到尾处理一项任务。它维护连续的思维线程(内存)和行动(工具),以确保每一步都能从之前的所有步骤中获得信息。

关键特征:
-
顺序执行: 动作一个接一个地执行。智能体在移动到步骤B之前完成步骤A。 -
统一上下文: 维护整个对话的单一连续历史。每个新步骤都可以访问所有先前的步骤、思维和工具输出。 -
有状态: 早期做出的决策直接且完全影响后续行动,无需消息传递。
优势:
-
上下文连续性:步骤之间不会丢失信息 -
简单性:更容易调试、测试和维护 -
透明性:清晰的执行路径和决策轨迹
劣势:
-
顺序瓶颈: 对于可以并行处理的任务来说速度较慢。 -
上下文窗口限制:最终会超出(有用的)上下文窗口,导致错误和遗忘细节。 -
效率低下:可能在重复的上下文上浪费令牌,并且限制于单一模型的能力/指令
什么是多智能体系统?
多智能体系统的结构就像一个团队。它通常涉及一个「主管智能体」,将目标分解为更小的子任务,然后将这些任务委派给可以并行操作的多个「工作智能体」。

关键特征:
-
并行执行: 子任务可以由多个智能体同时处理。 -
委派: 「主管」智能体通常分解主要目标,委派子任务,并综合来自工作智能体的结果。 -
分布式上下文: 每个智能体都使用自己的上下文运行,这通常是总信息的一个子集。
优势:
-
并行化:可以同时探索多条路径,减少延迟。 -
专业化:每个智能体都可以针对特定任务进行优化和指导 -
广度:可以解决复杂、多方面的问题。
劣势:
-
上下文:在智能体之间共享正确的上下文很困难 -
协调: 智能体可能重复工作或做出冲突的决策 -
成本: 可能更消耗令牌。(Anthropic:与标准聊天交互相比多15倍令牌)
注意: 值得一提的是其他多智能体模式,例如群体模式不使用「主管」智能体。相反,它们以更多的点对点方式协作解决问题,这既有单智能体又有多智能体的特征,例如统一上下文,但个别指令,但也带来了自己的挑战。
单智能体 vs 多智能体系统比较
|
|
|
---|---|---|
上下文管理 |
|
|
执行速度 |
|
|
令牌使用 |
|
|
可靠性 |
|
|
调试 |
|
|
最适合 |
|
|
协调 |
|
|
示例用例 |
|
|
核心优势 |
|
|
主要挑战 |
|
|
构建智能体的通用真理
尽管它们的观点相反,但构建严肃的智能体系统仍有共同原则适用。
-
上下文工程就是一切: 构建能够在正确时间动态维护正确信息以实现可靠决策的系统,是成功和可靠性的关键。这不仅仅是提示工程。 -
「读」vs「写」智能体: 重要的区别不是单智能体vs多智能体。而是你的任务主要涉及读(研究、分析、信息收集)还是写(代码生成、内容创建、文件编辑)。 -
读任务更容易并行化,更适合多智能体
-
写任务在并行化时会产生协调问题,更适合单智能体
-
混合任务应该在架构上分离读和写阶段
-
可靠的智能体需要不同的工具: 构建可靠的智能体需要的不仅仅是一个好的模型。它需要强大的基础设施来实现持久执行以在失败中存活,可观察性来调试行为,以及评估来衡量真正重要的事情。 -
经济可行性和模型改进: 模型本身正在以惊人的速度改进。不要为今天过度设计一个解决方案,而明天一个更简单的方案就可以为你解决。
Cognition: Don’t Build Multi-Agents: https://cognition.ai/blog/dont-build-multi-agents
[2]Anthropic: How we built our multi-agent research system: https://www.anthropic.com/engineering/built-multi-agent-research-system
[3]原文链接: Single vs Multi-Agent System?: https://www.philschmid.de/single-vs-multi-agents
(文:AGI Hunt)