单智能体 or 多智能体,怎么选?

文章来源: https://www.philschmid.de/single-vs-multi-agents
发布时间: 2025年6月20日
本文作者:Google DeepMind的AI 开发体验专家Philipp Schmid 

关于在AI社区中构建智能体的正确方式的争论,因为Cognition的「不要构建多智能体」和Anthropic的「我们如何构建多智能体研究系统」而变得激烈。尽管标题截然相反,但两者的观点却出奇地一致。

选择单智能体还是多智能体系统并不是意识形态问题,而是为正确的工作选择正确的工具。

在深入了解之前,让我们建立一个简单的定义。

AI 智能体是一个使用大型语言模型(LLM)作为推理引擎来决定应用程序控制流的系统。

什么是单智能体?

单智能体系统作为「单一进程」运行。可以把它想象成一个高度专注的工作者,从头到尾处理一项任务。它维护连续的思维线程(内存)和行动(工具),以确保每一步都能从之前的所有步骤中获得信息。

cognition-single-agent

关键特征:

  • 顺序执行: 动作一个接一个地执行。智能体在移动到步骤B之前完成步骤A。
  • 统一上下文: 维护整个对话的单一连续历史。每个新步骤都可以访问所有先前的步骤、思维和工具输出。
  • 有状态: 早期做出的决策直接且完全影响后续行动,无需消息传递。

优势:

  • 上下文连续性:步骤之间不会丢失信息
  • 简单性:更容易调试、测试和维护
  • 透明性:清晰的执行路径和决策轨迹

劣势:

  • 顺序瓶颈: 对于可以并行处理的任务来说速度较慢。
  • 上下文窗口限制:最终会超出(有用的)上下文窗口,导致错误和遗忘细节。
  • 效率低下:可能在重复的上下文上浪费令牌,并且限制于单一模型的能力/指令

什么是多智能体系统?

多智能体系统的结构就像一个团队。它通常涉及一个「主管智能体」,将目标分解为更小的子任务,然后将这些任务委派给可以并行操作的多个「工作智能体」。

multi-agent

关键特征:

  • 并行执行: 子任务可以由多个智能体同时处理。
  • 委派: 「主管」智能体通常分解主要目标,委派子任务,并综合来自工作智能体的结果。
  • 分布式上下文: 每个智能体都使用自己的上下文运行,这通常是总信息的一个子集。

优势:

  • 并行化:可以同时探索多条路径,减少延迟。
  • 专业化:每个智能体都可以针对特定任务进行优化和指导
  • 广度:可以解决复杂、多方面的问题。

劣势:

  • 上下文:在智能体之间共享正确的上下文很困难
  • 协调: 智能体可能重复工作或做出冲突的决策
  • 成本: 可能更消耗令牌。(Anthropic:与标准聊天交互相比多15倍令牌)

注意: 值得一提的是其他多智能体模式,例如群体模式不使用「主管」智能体。相反,它们以更多的点对点方式协作解决问题,这既有单智能体又有多智能体的特征,例如统一上下文,但个别指令,但也带来了自己的挑战。

单智能体 vs 多智能体系统比较

方面
单智能体系统
多智能体系统
上下文管理
连续,无损失
需要复杂的共享
执行速度
顺序
并行
令牌使用
4x聊天令牌
15x聊天令牌
可靠性
高,可预测
较低,涌现行为
调试
直接
复杂,非确定性
最适合
顺序、状态依赖任务(「写」任务)。
可并行化、探索性任务(「读」任务)。
协调
不需要
成功的关键因素
示例用例
重构代码库,编写详细文档。
研究广泛的市场趋势,识别标普500所有董事会成员。
核心优势
上下文连续性和可靠性
并行性和可扩展性
主要挑战
上下文窗口限制和顺序速度
上下文碎片化和协调复杂性

构建智能体的通用真理

尽管它们的观点相反,但构建严肃的智能体系统仍有共同原则适用。

  1. 上下文工程就是一切: 构建能够在正确时间动态维护正确信息以实现可靠决策的系统,是成功和可靠性的关键。这不仅仅是提示工程。
  2. 「读」vs「写」智能体: 重要的区别不是单智能体vs多智能体。而是你的任务主要涉及(研究、分析、信息收集)还是(代码生成、内容创建、文件编辑)。
    • 读任务更容易并行化,更适合多智能体

    • 写任务在并行化时会产生协调问题,更适合单智能体

    • 混合任务应该在架构上分离读和写阶段

    1. 可靠的智能体需要不同的工具: 构建可靠的智能体需要的不仅仅是一个好的模型。它需要强大的基础设施来实现持久执行以在失败中存活,可观察性来调试行为,以及评估来衡量真正重要的事情。
    2. 经济可行性和模型改进: 模型本身正在以惊人的速度改进。不要为今天过度设计一个解决方案,而明天一个更简单的方案就可以为你解决。



    [1]

    Cognition: Don’t Build Multi-Agents: https://cognition.ai/blog/dont-build-multi-agents

    [2]

    Anthropic: How we built our multi-agent research system: https://www.anthropic.com/engineering/built-multi-agent-research-system

    [3]

    原文链接: Single vs Multi-Agent System?: https://www.philschmid.de/single-vs-multi-agents


    (文:AGI Hunt)

    发表评论