自动化归因归档

ICML 2025 Spotlight 谁导致了多智能体系统的失败？首个「自动化失败归因」研究出炉

下午4时 2025/05/30 作者机器之心

本文介绍了一篇ICML 2025 Spotlight论文，提出自动化失败归因新任务以快速定位多智能体语言模型（LLM）系统的错误。研究构建首个Who&When数据集，并比较了三种方法：All-at-Once、Step-by-Step和Binary Search。实验结果显示当前方法效果有限，准确率较低；但混合策略有一定提升，且现有SOTA模型表现仍不理想。这表明失败归因任务对AI推理与理解能力要求极高。

一	二	三	四	五	六	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30