SGLang Team:在 96 个 H100 GPU 上部署具有 PD 分解和大规模专家并行性的 DeepSeek
25-05-05-large-scale-ep
DeepSeek 是一个广受欢迎的开源大型语言模型
25-05-05-large-scale-ep
DeepSeek 是一个广受欢迎的开源大型语言模型
DeepSeek V3 SGLang 优化
继续我们的DeepSeek V3与SGLang集成的技术
蚂蚁技术研究院和清华大学交叉信息院联合发布训练速度最快最稳定的开源强化学习训练框架AReaL,显著提升了数学推理能力,并通过创新性数据蒸馏技术复现了32B模型训练。