X-R1: 3B中文推理开源, 支持LoRA训练 下午2时 2025/02/19 作者 PaperAgent X-R1更新日志包括支持LoRA训练、发布中文训练配置及模型,成功进行大规模强化学习训练,增加标准实验脚本,支持3B模型的中文推理,并在Ascend 910B上运行成功。