资讯
国际
分享
大模型
学术
开源
机器人
关于我们

X-R1-1.5B

X-R1: 3B中文推理开源, 支持LoRA训练

下午2时 2025/02/19 作者 PaperAgent

X-R1更新日志包括支持LoRA训练、发布中文训练配置及模型，成功进行大规模强化学习训练，增加标准实验脚本，支持3B模型的中文推理，并在Ascend 910B上运行成功。

分类分享标签 7500、 LORA、 X-R1-1.5B、 X-R1-3B、华为Ascend 910B、奖励曲线发表评论

搜索

2025年 AGI AI AI技术 Anthropic ChatGPT Claude DeepSeek DeepSeek-R1 DeepSeek R1 GitHub GPT-4o LLM Manus Meta OpenAI Python Sam Altman 人工智能人形机器人具身智能大型语言模型大模型大语言模型字节跳动开源强化学习微软扩散模型技术创新智能体木易机器学习深度学习清华大学生成式AI 用户体验百度腾讯自然语言处理英伟达谷歌阿里云阿里巴巴马斯克

近期文章

干货满满！图灵奖学术大牛和宇树、智谱等明星AI企业齐聚，探讨AI产业新风向
“AGI 五年内或将实现”：AI 教父 Bengio 呼吁中美达成共识，警惕 AI 沦为人类武器
深夜突袭！谷歌Gemini 2.5 Pro更新蝉联榜一：推理超越o3，编程超越opus4
强化学习之父Richard Sutton：人类数据耗尽，AI正在进入“经验时代”！
免费约饭！美国CVPR 2025，相聚人才晚宴

分类

分享
国际
大模型
学术
开源
机器人
资讯

2025 年 6 月
一	二	三	四	五	六	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30

« 5 月

归档

2025 年 6 月
2025 年 5 月
2025 年 4 月
2025 年 3 月
2025 年 2 月
2025 年 1 月
2024 年 12 月
2024 年 11 月

AI新闻 | X平台｜ APK反编译｜京ICP备2024096144号｜

© 2025 每时AI • Built with GeneratePress

下载我们的APP，AI秒送达！立即下载

×