DeepSeek开源周Day 2: DeepEP——解锁MoE模型通信瓶颈 下午2时 2025/02/25 作者 硅星GenAI DeepEP是针对Hopper GPU优化的MoE模型训练与推理高效通信库,支持FP8和低延迟推理解码,通过NVLink和RDMA提升效率。