LLM「啊哈时刻」竟会自我纠正,单体数学性能暴涨!UIUC华人一作 下午11时 2025/03/02 作者 新智元 短板却一直令人头疼。UIUC联手马里兰大学全华人团队提出一种革命性的自我奖励推理框架,将生成、评估和