无需标注数据!清华TTRL让AI自学正确率飙升159%,数学题秒变送分题 下午2时 2025/05/05 作者 小兵的AI视界 清华大学和上海人工智能实验室提出测试时强化学习(TTRL),通过在无标签数据上利用多数投票等方法估计奖励信号来提升大规模语言模型性能。