一份系统性的 LLM 微调实战指南:FineTuningLLMs 2025年7月9日8时 作者 NLP工程化 详细介绍了量化、LoRA 适配器、数据格式化等核心技术,并分享了在单个 GPU 上高效微调大语言模型的方法和实践案例。
Unsloth 发布了 GRPO 的新互动教程 (ipynb notebook) 2025年5月15日8时 作者 NLP工程化 Unsloth 发布了GRPO的新互动教程,用户可以轻松微调Qwen3-Base并开启其思考模式,实现几乎无监督学习。