X-R1:低成本训练0.5B R1-Zero模型的高效框架。亮点:
-
仅需4张3090/4090显卡,1小时训练成本不到7美元; -
10分钟内即可输出“aha moment”,加速模型开发; -
支持更大规模模型,如1.5B、7B等。



参考文献:
[1] http://github.com/dhcode-cpp/X-R1
[2] https://huggingface.co/xiaodongguaAIGC
(文:NLP工程化)
X-R1:低成本训练0.5B R1-Zero模型的高效框架。亮点:
参考文献:
[1] http://github.com/dhcode-cpp/X-R1
[2] https://huggingface.co/xiaodongguaAIGC
(文:NLP工程化)