Google Colab 归档 - 每时AI

一份系统性的 LLM 微调实战指南：FineTuningLLMs

2025年7月9日8时作者 NLP工程化

详细介绍了量化、LoRA 适配器、数据格式化等核心技术，并分享了在单个 GPU 上高效微调大语言模型的方法和实践案例。

Unsloth 发布了 GRPO 的新互动教程 (ipynb notebook)

2025年5月15日8时作者 NLP工程化

Unsloth 发布了GRPO的新互动教程，用户可以轻松微调Qwen3-Base并开启其思考模式，实现几乎无监督学习。