实践案例归档

专注于强化学习（RL）提升大语言模型（LLM）推理能力的资源库

上午8时 2025/02/19 作者 NLP工程化

Awesome-RL-based-LLM-Reasoning 是一个专注于提升大语言模型推理能力的资源库，汇集了最新的相关论文、幻灯片和开源项目，涵盖多种RL方法和LLM推理优化技巧。