deepseek-ai归档

DeepSeek-R1 解读及技术报告中文版

下午2时 2025/03/03 作者机器学习算法与自然语言处理

MLNLP社区致力于促进国内外机器学习与自然语言处理领域的交流合作。最新研究成果《DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning》通过纯强化学习实现了模型推理能力的自主进化，并结合蒸馏技术实现高效迁移，显著提升了多项任务表现。

DeepSeek今日连开3源！针对优化的并行策略，梁文锋本人参与开发

下午4时 2025/02/27 作者量子位

DeepSeek开源周第四天发布三项优化并行策略的技术成果，包括DualPipe、EPLB和Profiling Data。DualPipe是一种双向流水线并行算法，旨在减少计算与通信阶段的气泡；EPLB是MoE模型负载均衡器，确保计算资源平衡利用；Profiling Data提供了实际应用中的效果数据可视化支持。

DeepSeek开源第三弹：惊人的300行代码驱动R1和V3的训练与推理，超越各种专家内核

下午12时 2025/02/26 作者 AI寒武纪

DeepSeek-AI 发布了 DeepGEMM 库，专为 Hopper GPU 架构的 FP8 矩阵乘法加速。其性能高达 1350+ TFLOPS，代码简洁至仅 300 行。该库支持稠密模型和混合专家模型，并通过多种技术实现高效优化，提供详细实测数据及安装指南。

1月2日周四 | Python热门项目

下午2时 2025/01/02 作者 AIGC创想者

10个Python项目排行：从推荐系统到多语言语音转换工具，涵盖多种应用场景。

一	二	三	四	五	六	日
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31