Unsloth AI发了一个动态1bit的DeepSeek-R1-0528量化模型 2025年5月31日8时 作者 NLP工程化 Unsloth发布动态1bit DeepSeek-R1-0528模型,将模型大小从715GB减少至185GB。
7G显存,训练自己的DeepSeek-R1,GRPO资源暴降80% 2025年2月10日19时 作者 PaperAgent Unsloth AI 提供了 GRPO 训练算法,使用户能够在仅 7GB VRAM 上重现 DeepSeek R1-Zero 的‘顿悟时刻’,相比传统方法减少约80%的 VRAM 使用量。
如何将671B满血版DeepSeek R1部署到本地?保姆级教程来了!有手就会 2025年2月5日16时 作者 PaperWeekly ©作者 | 李锡涵 单位 | 伦敦大学学院 来源 | 机器之心 过年这段时间,DeepSeek 算是