金磊 发自 凹非寺
量子位 | 公众号 QbitAI
DeepSeek的热,还在持续ing。
就在刚刚过去的周末,DeepSeek反超ChatGPT,一举登顶美区苹果应用商店免费App排行第一!
其热度之高,有网友甚至这样描述:
我甚至都不喜欢AI助手应用,但我已经下载了DeepSeek。
至于原因,正是DeepSeek在前几天开源的推理模型R1,引发了一阵又一阵的舆论热潮。
仅仅花费560万美元训练的R1,在很多AI基准测试中已经达到甚至超越OpenAI o1模型。
而且DeepSeek是真的免费,而ChatGPT虽然在免费榜上,但要是想解锁它的完全体,还是要掏上200美元……
现在要是在X上搜“DeepSeek”,目之所及,处处都是“使用DeepSeek构建一切”、“Goodbye ChatGPT”这样的话题:
并且不止是科技圈的人在关注,例如风险投资家Marc Andreessen就高度称赞道:
DeepSeek R1是我见过最令人惊叹的突破之一。
就连回应“DeepSeek将如何盈利”这个问题中的一句话——“DeepSeek是一个小项目”,也是被网友们转疯了……
嗯,火,着实是有点火。
也刚引发一波复现热潮
作为本身就是开源模型的DeepSeek R1,就在昨天还引发了一股复现热潮。
这个项目就是由HuggingFace在GitHub上发起的Open R1。
项目仅仅发布2天,已经斩获4.2K个Star。
联合创始人兼CEO Clem Delangue表示:
我们的科学团队已经开始致力于完全复制和开源R1,包括训练数据、训练脚本……
我们希望能充分发挥开源AI的力量,让全世界每个人都能受益于AI的进步!我相信这也有助于揭穿一些神话。
而在Open R1的项目文档中,官方进一步表示:
这个项目的目的是构建R1 pipeline中缺失的部分,以便所有人都能在此之上复制和构建R1。
HuggingFace表示,将以DeepSeek-R1的技术报告为指导,分3个步骤完成这个项目:
第1步:用DeepSeek-R1蒸馏高质量语料库,来复制R1-Distill模型。
第2步:复制DeepSeek用来构建R1-Zero的纯强化学习(RL)pipeline。这可能涉及为数学、推理和代码整理新的大规模数据集。
第3步:通过多阶段训练,从基础模型过渡到RL版本。
除了复现潮之外,网友们分享的玩法也是层出不穷。
例如一个小哥分享的《用DeepSeek R1构建一切》,手把手教你怎么做游戏、开发编程等等。
而从DeepSeek的热度延伸出来,国货之光的含金量还在上升:
先是DeepSeek,现在是Kimi k1.5……中国(大模型)的发展速度非常快。
对于DeepSeek引爆的热点话题,LeCun则站出来表示:
我们要关注的真正的点,应该是开源模型正在超越专有模型。
DeepSeek接下来还会引发怎样的热潮,是值得继续关注一波。
(文:量子位)