7G显存,训练自己的DeepSeek-R1,GRPO资源暴降80%
Unsloth AI 提供了 GRPO 训练算法,使用户能够在仅 7GB VRAM 上重现 DeepSeek R1-Zero 的‘顿悟时刻’,相比传统方法减少约80%的 VRAM 使用量。
Unsloth AI 提供了 GRPO 训练算法,使用户能够在仅 7GB VRAM 上重现 DeepSeek R1-Zero 的‘顿悟时刻’,相比传统方法减少约80%的 VRAM 使用量。
671B参数的DeepSeek R1在UnslothAI团队的技术优化下成功压缩至131GB,仅需160GB显存即可运行。该模型在多项基准测试中表现出色,为开发者和用户提供了一种新的量化压缩思路。
国内首个对标AlphaFold3的产品——HelixFold3发布,支持在线服务并大幅降低推理成本。在RNA分子和抗原-抗体结构预测方面实现媲美甚至超越AlphaFold3的精度,并且用户只需简单开通即可使用,应用场景丰富。