DeepEP 归档 - 第2页共2页

DeepSeek开源周第二天：DeepEP通信库，解锁MoE模型通信瓶颈

2025年2月25日16时作者 Founder Park

）和专家并行（EP）打造的高效通信库 — DeepEP。
就在半小时前，官方对此进行了发布，以下是由

刚刚，DeepSeek开源MoE训练、推理EP通信库DeepEP，真太Open了！

2025年2月25日16时作者机器之心

DeepSeek 开源首个用于MoE模型训练和推理的EP通信库 DeepEP，优化高效通信和并行处理，支持FP8精度，并提供灵活资源调度。

DeepSeek又又开源了，这次拉爆GPU通信！

2025年2月25日12时作者智东西

网友：突破AI基础设施极限。DeepSeek发布首个用于MoE模型训练和推理的开源EP通信库，支持NVLink和RDMA等硬件，提供高吞吐量且低延迟的全对全GPU内核，加速大规模MoE模型任务。

DeepSeek开源第二弹，为MoE和EP量身定制的通信库！暂和英伟达显卡绑定

2025年2月25日12时作者量子位

DeepSeek开源第二弹来了！首个用于MoE模型训练和推理的开源EP通信库DeepEP提供高吞吐量和低延迟的all-to-all GPU内核，支持低精度运算包括FP8。性能方面涵盖高效和优化的all-to-all通信、NVLink和RDMA的支持、预填充任务和推理解码任务等。团队建议使用Hopper GPUs及更高版本Python 3.8及以上CUDA 12.3及以上PyTorch 2.1及以上环境，并提供详细的使用指南。

刚刚，DeepSeek开源DeepEP，公开大模型训练效率暴涨秘诀！

2025年2月25日12时作者 AIGC开放社区

专注AIGC领域的专业社区分享了开源的DeepEP库，用于优化混合专家模型训练和推理。DeepEP支持高效的All-to-All通信机制、高吞吐量和低延迟内核，以及原生支持FP8格式。

一	二	三	四	五	六	日
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30	31