蚂蚁清华联手放大招!彻底开源RL框架AReaL-boba,人人可复现QwQ 上午11时 2025/04/03 作者 AI科技大本营 蚂蚁与清华大学联合推出的AReaL开源强化学习框架发布里程碑版本,提供详细的教程和高性能的SGLang框架集成,大幅提升训练速度,并在数学推理能力上达到同尺寸模型的SOTA水平。
分析一下EP并行和DeepSeek开源的DeepEP代码 下午2时 2025/02/28 作者 GiantPandaCV 非常棒的工作,很多细节都值得学习. 但是还有一些硬件上的缺陷, 在DeepSeek-V3的论文中提