你永远叫不醒装睡的大模型!多轮对话全军覆没,性能暴跌39% 下午4时 2025/06/07 作者 新智元 研究人员进行了一项超过20万次的模拟实验,评估了多个大语言模型在单轮和多轮对话中的性能差异。结果显示大多数模型在多轮对话中表现下降,这被称为‘对话迷失’现象。