Google研究发现：Multi-Agent的核心竟然是Prompt设计！

在多智能体系统（MAS：multi-agent systems）中，设计有效的提示和拓扑结构面临挑战，因为单个智能体可能对提示敏感，且手动设计拓扑结构需要大量实验。

为了自动化整个设计过程，Google&剑桥大学首先对设计空间进行了深入分析，旨在了解构建有效MAS的因素。发现：提示设计对下游性能有显著影响，而有效的拓扑结构只占整个搜索空间的一小部分。

在数学问题上，Gemini 1.5 Pro 对比仅使用自我一致性（SC）、自我细化（reflect）和多智能体辩论（debate）进行扩展的智能体，展示了每个问题的提示优化智能体的准确率与总标记数的关系。误差条表示1个标准差。我们表明，通过更有效的提示，利用更多的计算资源可以获得更高的准确率。

使用 Gemini 1.5 Pro 的不同拓扑结构的性能与基础智能体相比，每个拓扑结构都通过 APO 进行了优化，其中“Sum.”（总结）和“Exe.”（执行器）是如图4所示的任务特定拓扑结构。我们观察到，并非所有拓扑结构都对多智能体系统（MAS）设计有积极影响。

基于这些发现，Google&剑桥大学提出了Mass框架，该框架通过三个阶段优化MAS：

提出的多智能体系统搜索（Mass）框架通过在可定制的多智能体设计空间中交错进行提示优化和拓扑优化，发现了有效的多智能体系统设计（右侧为经过优化的拓扑结构和优化的提示），关键组件如左侧所示

实验使用了Gemini 1.5 Pro和Flash模型，并与多种现有方法进行了比较，包括链式思考（CoT）、自我一致性（SC）、自我细化（Self-Refine）、多智能体辩论（Multi-Agent Debate）、ADAS和AFlow。

https://arxiv.org/pdf/2502.02533Multi-Agent Design: Optimizing Agents with Better Prompts and Topologies

（文：PaperAgent）