专注于强化学习(RL)提升大语言模型(LLM)推理能力的资源库 上午8时 2025/02/19 作者 NLP工程化 Awesome-RL-based-LLM-Reasoning 是一个专注于提升大语言模型推理能力的资源库,汇集了最新的相关论文、幻灯片和开源项目,涵盖多种RL方法和LLM推理优化技巧。