Intuitor 归档 - 每时AI

UC伯克利新作颠覆认知：LLM靠「自信爆表」学会推理？无需外部奖励超进化

2025年5月31日16时作者新智元

推理了？UC伯克利的华人团队发现，LLM居然跟人一样！靠自信来训练AI后，数学、编程性能提升惊人。

2025年5月29日16时作者量子位

UC Berkeley团队提出的新方法Intuitor通过优化模型自身的置信程度来提升大模型的复杂推理能力，无需外部奖励信号或标准答案。与传统强化学习相比，Intuitor能有效减少无效响应并提高模型在数学和代码生成任务中的表现。