SGLang 归档 - 第2页共2页 - 每时AI

SGLang Team：在 96 个 H100 GPU 上部署具有 PD 分解和大规模专家并行性的 DeepSeek

2025年5月6日19时作者 GiantPandaCV

25-05-05-large-scale-ep
DeepSeek 是一个广受欢迎的开源大型语言模型

DeepSeek-V3 + SGLang: 推理优化 (v0.4.3.post2+sgl-kernel:0.0.3.post6)

2025年4月9日14时作者 GiantPandaCV

DeepSeek V3 SGLang 优化
继续我们的DeepSeek V3与SGLang集成的技术

200美金，人人可手搓QwQ，清华、蚂蚁开源极速RL框架AReaL-boba

2025年3月31日11时作者机器之心

蚂蚁技术研究院和清华大学交叉信息院联合发布训练速度最快最稳定的开源强化学习训练框架AReaL，显著提升了数学推理能力，并通过创新性数据蒸馏技术复现了32B模型训练。

SGLang 支持Flash Attention V3 Backend

2025年3月26日19时作者 GiantPandaCV

lgorithm-in-cuda/tree/master/cuda-mode 。主要是LLM和cud

当开源创新遇上推理革命：SGLang如何炼就DeepSeek最强开源推理引擎？

2025年3月6日23时作者机器之心

语言建模与推理能力，引爆了全球 AI 社区。与此同时，一个隐藏在超大规模模型身后的技术命题浮出水面：

一个使用 SGLang + SkyPilot 实现高吞吐量 DeepSeek-R1 服务的教程

2025年3月4日8时作者 NLP工程化

使用 SGLang + SkyPilot 实现高吞吐量 DeepSeek-R1 服务的教程介绍分享。

SGLang DP MLA 特性解读

2025年2月14日14时作者 GiantPandaCV

lgorithm-in-cuda 。
这里简要解析了一下SGLang v0.4版本中针对DeepSe

SGLang：LLM推理框架

2025年2月9日8时作者 NLP工程化

多个云平台推荐使用SGLang框架提供或教授部署DeepSeek的方法。相关资源和文档链接已提供。