吴恩达有关deepseek的观点:中国崛起、开放权重、应用爆发、算力需求

吴恩达近日刊文对DeepSeek及其影响发表了自己的看法,下面是他文章的翻译全文:

亲爱的朋友们:

本周,DeepSeek引发的热议让人们清楚地认识到几个重要的发展趋势:(1)中国在生成式人工智能领域正在赶上美国,这对人工智能供应链产生影响。(2)开放权重模型正在使基础模型层商品化,这为应用程序开发者创造了机会。(3)扩大规模并不是人工智能进步的唯一途径。尽管人们非常关注和炒作算力,但算法创新正在迅速降低训练成本。

大约一周前,中国公司DeepSeek发布了DeepSeek-R1,这是一个卓越的模型,其在基准测试中的表现可与OpenAI的o1相媲美。此外,它还以宽松的MIT许可证发布为开放权重模型。上周在达沃斯,许多非技术出身的商业领袖向我询问了有关DeepSeek-R1的问题。周一,股市出现了“DeepSeek抛售”:英伟达和许多其他美国科技公司的股价暴跌。(截至撰稿时,一些股票已有所回升。)

我认为DeepSeek让很多人意识到:

1. 中国正在生成式人工智能领域赶上美国。 2022年11月ChatGPT推出时,美国在生成式人工智能领域明显领先于中国。人们的印象转变缓慢,因此即使最近,我仍然听到美国和中国的朋友说他们认为中国落后。但事实上,过去两年,这一差距迅速缩小。随着中国模型(例如我的团队已经使用了几个月的Qwen)、Kimi、InternVL和DeepSeek的出现,中国显然一直在缩小差距,并且在视频生成等领域,中国似乎已经处于领先地位。

2. 开放权重模型是人工智能供应链的关键组成部分。 我很高兴DeepSeek-R1以开放权重模型发布,并附有分享许多细节的技术报告。相比之下,一些美国公司一直在推动监管,通过炒作诸如人类灭绝等假设性的人工智能危险来扼杀开源。现在很明显,开源/开放权重模型是人工智能供应链的关键组成部分:许多公司将使用它们。如果美国继续阻碍开源,中国将主导供应链的这一部分,许多企业最终将使用更能反映中国价值观而非美国价值观的模型。

3. 开放权重模型正在使基础模型层商品化。 正如我之前写道,LLM令牌价格一直在迅速下降,开放权重推动了这一趋势,并为开发者提供了更多选择。OpenAI的o1每百万个输出令牌的价格为60美元;DeepSeek R1的价格为2.19美元。近30倍的差异引起了许多人对价格下跌趋势的关注。

4. 训练基础模型和销售API访问的业务很艰难。 该领域的许多公司仍在寻找一条能够弥补巨额模型训练成本的道路。红杉资本的文章“人工智能的6000亿美元问题”很好地阐述了这一挑战(但需要明确的是,我认为基础模型公司做得非常出色,我希望他们能够成功)。相比之下,在基础模型之上构建应用程序则带来了许多绝佳的商机。现在,其他人已经花费数十亿美元训练此类模型,你可以仅花费数美元就能访问这些模型,从而构建客户服务聊天机器人、电子邮件摘要器、人工智能医生、法律文件助理等等。

5. 扩大规模并不是人工智能进步的唯一途径。 人们对扩大模型规模以推动进步的做法大肆炒作。公平地说,我曾是扩大模型规模的早期支持者。一些公司通过围绕这样一种说法制造热点而筹集了数十亿美元:有了更多的资金,他们就可以(1)扩大规模,并且(2)可预测地推动改进。因此,人们一直非常关注扩大规模,而不是采取更细致的观点,即适当关注我们可以通过许多不同的方式取得进展。部分受美国人工智能芯片禁运的影响,DeepSeek团队不得不进行许多优化,以便在性能较低的H800 GPU而不是H100 GPU上运行,最终使得模型的训练成本(不包括研究成本)低于600万美元。

这是否会真正减少对算力的需求,还有待观察。有时,降低一件商品的单价可能会导致购买该商品的总金额增加。我认为从长远来看,对智能和算力的需求几乎没有上限,因此我仍然乐观地认为,即使智能变得更便宜,人类也会使用更多的智能。
我在X上看到了许多人对DeepSeek进展的不同解读,仿佛它是一个罗夏墨迹(Rorschach)测试,让许多人可以将自己的意义投射到上面。我认为DeepSeek-R1具有尚未解决的地缘政治影响。它对人工智能应用程序开发者来说也很棒。我的团队已经开始集思广益,思考一些只有在我们能够轻松访问开放的高级推理模型的情况下才有可能实现的想法。这仍然是一个伟大的建设时代!

原文:https://www.deeplearning.ai/the-batch/issue-286/

(文:AI工程化)

欢迎分享

发表评论