深度剖析DeepSeek V3-0324最新更新 上午11时 2025/03/25 作者 PyTorch研习社 此次更新对基础模型进行了优化,同时保持了经济高效的训练与推理成本。它基于强大的混合专家(Mixtur
DeepSeek企业落地应用讲义精华版(258页) 下午2时 2025/03/09 作者 AI技术研习社 近期DeepSeek因其Mixture of Experts架构在国内外引起关注,本次培训将全面解析其核心功能及应用场景。
大模型上周回顾及Deepseek开源周总结:兼看面向多任务的模型融合思路 下午2时 2025/03/03 作者 老刘说NLP ,发现一些有趣的问题,比如模型参数融合的玩法,会有更多收获。 围绕模型参数融合,MOE可视化图解,d
DeepSeek开源周[2]:MoE通信库DeepEP 下午2时 2025/02/26 作者 子非AI 来惊喜! • DeepEP 正式开源 !这是 DeepSeek 开源周的第二个重磅项目。 • Dee