7G显存,训练自己的DeepSeek-R1,GRPO资源暴降80% 下午7时 2025/02/10 作者 PaperAgent Unsloth AI 提供了 GRPO 训练算法,使用户能够在仅 7GB VRAM 上重现 DeepSeek R1-Zero 的‘顿悟时刻’,相比传统方法减少约80%的 VRAM 使用量。
如何将671B满血版DeepSeek R1部署到本地?保姆级教程来了!有手就会 下午4时 2025/02/05 作者 PaperWeekly ©作者 | 李锡涵 单位 | 伦敦大学学院 来源 | 机器之心 过年这段时间,DeepSeek 算是
完整的671B R1塞进本地,详尽教程来了! 下午7时 2025/02/04 作者 Datawhale Datawhale干货 作者:李锡涵,编译 :机器之心 本文作者:李锡涵(Xihan Li) 作者简