X-R1:低成本训练0.5B R1-Zero模型的高效框架 上午8时 2025/02/15 作者 NLP工程化 低成本高效训练R1-Zero模型,仅需4张3090/4090显卡1小时成本不到7美元,支持更大规模模型。