意图检测归档

泛化性暴涨47%！首个意图检测奖励范式，AI工具爆炸时代意图识别新解法

下午4时 2025/05/16 作者机器之心

腾讯研究团队采用强化学习结合课程采样策略训练意图识别模型，显著提升其在未知意图上的泛化能力。该方法能有效指导模型关注更具挑战性的数据样本，并通过实验验证了GRPO算法优于传统SFT方法的性能优势。