Datawhale

DeepMind首席科学家最新万字访谈：模型「慢思考」，能力大幅提升！

下午7时 2025/02/28 作者 Datawhale

ind 首席科学家 Jack Rae 接受访谈，就谷歌思维模型的发展进行深入讨论。
Jack Rae

下午7时 2025/02/28 作者 Datawhale

、
机器之心
今天凌晨4点，OpenAI进行了在线技术直播，
奥特曼并没有现身
。
OpenAI 正

下午7时 2025/02/28 作者 Datawhale

望通过比较通俗的方式给大家直观感受大模型微调后的效果，相关是思路想法旨在起到抛砖引玉的效果，如果学习

下午2时 2025/02/27 作者 Datawhale

DeepSeek在OpenSourceWeek分享了多个开源项目，包括用于V3/R1训练的DualPipe、EPLB负载均衡算法以及用于深度学习模型的profile-data分析数据。

下午2时 2025/02/26 作者 Datawhale

tl），祝武（清华大学）
2025 年春节前夕，DeepSeek 一经推出迅速“走红”，受到了国内外

下午2时 2025/02/26 作者 Datawhale

通过 RagFlow 框架，介绍如何将 DeepSeek 接入个人知识库中。RagFlow 是一款基于深度文档理解的开源检索增强生成引擎，适用于多种场景如智能客服、文档生成等。

下午2时 2025/02/25 作者 Datawhale

的效果。
微调前：
微调后：
在此处可以看到很明显大模型进行微调后口吻已经发生了更改。据笔者使用下来

下午2时 2025/02/25 作者 Datawhale

DeepSeek发布第二款开源软件库DeepEP，专为MoE模型训练与推理设计，提供高效的全对全通信计算核，支持FP8精度运算。

下午2时 2025/02/25 作者 Datawhale

需求，却深深嵌入了我们的日常生活。无论是查资料、买东西，还是了解新闻，搜索引擎早已成为我们获取信息的

下午2时 2025/02/25 作者 Datawhale

模型的消息开始在 AI 社区广泛发酵，不过并不是期待中的 Claude 4.0，而是 3.7 Son