2025年2月25日16时 - 第6页共12页

刚刚，DeepSeek开源MoE训练、推理EP通信库DeepEP，真太Open了！

2025年2月25日16时作者机器之心

DeepSeek 开源首个用于MoE模型训练和推理的EP通信库 DeepEP，优化高效通信和并行处理，支持FP8精度，并提供灵活资源调度。

2025年2月25日16时作者 PaperWeekly

文题目：
Uncertainty-Aware Graph Structure Learning
论文

2025年2月25日16时作者机器之心

不过并不是期待中的 Claude 4.0，而是 3.7 Sonnet 版本。
图源：https://

2025年2月25日16时作者 AI寒武纪

DeepSeek OpenSourceWeek 发布了首个面向MoE模型的开源EP通信库 DeepEP。它提供了高性能All-to-All通信内核、集群内和集群间全面支持，以及训练和推理预填充及推理解码低延迟内核等特性。性能测试显示其在不同场景下都能提供出色的通信性能。

2025年2月25日16时作者 PaperWeekly

|
自然语言处理
概述
背景
基于大语言模型（LLMs）的智能体（agent）已经被证实其能像人类

2025年2月25日14时作者老刘说NLP

近日推理大模型相关前沿回顾包括Claude 3.7的发布，Qwen的QwQ模型开源，FlashMLA的开源及PaliGemma 2 Mix模型的开源。文章还总结了大模型逻辑推理技术，并提出了一些值得思考的问题。