重磅开源!首个全异步强化学习训练系统来了,SOTA推理大模型RL训练提速2.77倍 上午8时 2025/06/05 作者 机器之心 高门槛劝退?AReaL 全面升级,更快,更强,更好用! 来自清华大学交叉信息院和蚂蚁技术研究院的联合