1.5B
7G显存,训练自己的DeepSeek-R1,GRPO资源暴降80%
Unsloth AI 提供了 GRPO 训练算法,使用户能够在仅 7GB VRAM 上重现 DeepSeek R1-Zero 的‘顿悟时刻’,相比传统方法减少约80%的 VRAM 使用量。
JinaAI开源升级!一个开源HTML转Markdown和JSON的小型语言模型,参数仅有1.8B。
在大数量级AI数据处理场景下,JinaAI的ReaderLM-v2语言模型通过将原始HTML转换为Markdown或JSON格式解决了资源消耗问题,并实现了更好的Markdown生成、新增JSON输出及更强的上下文和多语言支持。