20万归档 - 每时AI

你永远叫不醒装睡的大模型！多轮对话全军覆没，性能暴跌39%

下午4时 2025/06/07 作者新智元

研究人员进行了一项超过20万次的模拟实验，评估了多个大语言模型在单轮和多轮对话中的性能差异。结果显示大多数模型在多轮对话中表现下降，这被称为‘对话迷失’现象。