X-R1:低成本训练0.5B R1-Zero模型的高效框架

X-R1:低成本训练0.5B R1-Zero模型的高效框架。亮点:

  1. 仅需4张3090/4090显卡,1小时训练成本不到7美元;
  2. 10分钟内即可输出“aha moment”,加速模型开发;
  3. 支持更大规模模型,如1.5B、7B等。

参考文献:
[1] http://github.com/dhcode-cpp/X-R1
[2] https://huggingface.co/xiaodongguaAIGC


(文:NLP工程化)

发表评论