12节点集群归档

让DeepSeek模型变更强！SGLang团队将吞吐量提高5倍，API成本降到官方五分之一

2025年5月8日23时作者头部科技

SGLang团队在开源技术博客中介绍了如何优化DeepSeek模型，在96个H100 GPU上实现了显著性能提升。通过引入PD分解、TBO以及专家重新平衡等策略，提高了预填充和解码阶段的吞吐量，并减少了不平衡现象对性能的影响。