一个简单高效的 LLM 强化学习库:nanoAhaMoment 上午8时 2025/04/09 作者 NLP工程化 GitHub 上发布 nanoAhaMoment 库,仅需单个 80G GPU 即可实现高效 LLM 强化学习训练,支持微调基础模型并附有教程。