Multi-Agent多智能体为什么会失效?R1类推理模型训练及推理的2个有趣实验结论 下午2时 2025/03/27 作者 老刘说NLP 今日讨论了R1推理模型及多智能体相关实验,涵盖思考后再思考提升效果、训练数据长度的重要性以及多智能体系统失效机制三方面内容。