模仿、探索与自我提升:慢思考推理系统的复现之路 下午2时 2024/12/16 作者 PaperWeekly ©作者 | 蒋锦昊,陈志朋,闵映乾 单位 | 中国人民大学 研究方向 | 大语言模型与推荐系统 近年