DeepSeek团队归档

DeepSeek-R1发布后的100天复现之旅方法总结

MLNLP社区发布论文介绍复现推理大模型技术，强调让AI学会思考而非仅背答案；提出监督微调与强化学习两大方法，并讨论未来发展方向。

下午2时 2025/04/14 作者 AI技术研习社

DeepSeek通过深度学习和大数据分析提升家庭教育质量，整合教育资源并提供定制化方案，助力实现个性化培养。

下午12时 2025/02/26 作者 AIGC开放社区

DeepSeek开源高效FP8精度矩阵乘法库DeepGEMM，支持NVIDIA Hopper架构，在密集和分组矩阵乘法下性能提升显著，使用方便，支持广泛应用场景。

上午8时 2025/02/25 作者 NLP工程化

DeepSeek开源其最新模型FlashMLA，欢迎加入Dify知识星球获取更多资源和技术支持。

下午11时 2025/02/17 作者 AI寒武纪

代码生成专家DeepSeek提出CodeI/O方法，通过将代码转化为预测输入-输出格式，结合自然语言思维链解释来增强通用AI推理能力。

下午12时 2025/01/28 作者硅星人Pro

如果我们问AI这样一个简洁的问题——
“玄武门之变结束的当天，李世民在深夜写下一段独白，你觉得他会写

下午4时 2025/01/27 作者多知

DeepSeek在美区和中国区App Store免费榜上超越ChatGPT并获得好评。其模型在多项测试中表现优异，特别适合教育领域使用。DeepSeek-R1具有高性价比、技术创新及开源特性，能够提供深度思考过程的细致回答，并且能辅助教师或家长出题，但识别能力有待提升。