在 96 块 H100 GPU 上通过参数分解与大规模专家并行技术部署 DeepSeek 上午8时 2025/05/09 作者 NLP工程化 通过参数分解与大规模专家并行技术部署DeepSeek,在96块H100GPU上实现接近官方吞吐量的开源实现。