a16z的普通合伙人和 Mistral 董事会成员Anjney “Anj” Midha告诉 TechCrunch,六个月前他首次注意到DeepSeek 令人惊叹的表现。
这时,DeepSeek 推出了 Coder V2,该产品在编码特定任务上与 OpenAI 的 GPT4-Turbo 相抗衡,依据它去年发布的一篇论文。他表示,这使 DeepSeek 走上了每隔几个月发布改进模型的道路,一直到 R1。R1 是其新的开源推理模型,颠覆了科技行业,以极低的成本提供行业标准的性能。
尽管英伟达股票的抛售,Midha 表示 R1 并不意味着 AI 基础模型会停止花费数十亿来吞噬 GPU 芯片,并尽快建立更多数据中心。
这意味着他们将利用他们能够获得的计算能力做更多的事情。
“当人们说,好的,Anj,Mistral 已经筹集了十亿美元,”他说。“DeepSeek 是否意味着那十亿美元完全没有必要?不,实际上,他们能够关注 DeepSeek 的效率提升,内化这些提升,然后再投入十亿美元,这对他们来说是极其有价值的。”
他补充道:“现在我们可以从相同的计算中获得 10 倍的产出。”
这并不意味着 Mistral 在竞争对手 OpenAI 和 Anthropic 面前毫无希望,他辩称。它们每个都筹集了比 Mistral 多得多的资金。OpenAI 据报道正在谈判再筹集一笔令人震惊的 400 亿美元。
Mistral 之所以能与他们竞争,是因为它是开源的,他说。他的逻辑确实有道理。开源使公司能够获得来自那些希望帮助的人的基本免费技术劳动力,因为他们使用该项目。闭源的竞争对手则保护他们的秘密,必须为所有劳动力以及计算能力付费。
“你不需要 200 亿美元。你只需要比任何其他开源模型应用更多的计算能力。所以 Mistral 的定位很好。他们拥有的计算能力是所有开源提供商中最多的,”Midha 谈到他的投资组合公司时说道。
Facebook 的 Llama,最大的西方开源 AI 模型,竞争对手是 Mistral,也将获得更多投资。首席执行官马克·扎克伯格在周三表示,他仍计划在 AI 上花费“数千亿美元”。这包括在 2025 年用于资本支出的 600 亿美元,主要用于数据中心。
a16z 的 Oxygen GPU 共享计划“超额预订”
Midha,作为 AI 图像生成器 Black Forest Labs 和3D 模型制造商 Luma的董事会成员(同时也是 AI 公司 Anthropic、ElevenLabs 等的天使投资人),还有另一个原因让他认为 AI 对 GPU 的需求不会很快减弱。
他是 a16z 的 Oxygen 项目的领导者。GPU,特别是 Nvidia 最先进的 H100,已经变得如此稀缺,以至于这家风险投资公司大约在一年半前采取了行动。它为其投资组合公司购买了一批这些设备供其使用。
“现在超额预订了。我无法分配足够的,”Midha 笑着说。他的初创公司不仅需要 GPU 来进行 AI 模型训练,而且还需要更多的 GPU 来运行他们为客户提供的持续 AI 产品。
“现在对推理和消费有着这种无法满足的需求,”他解释道。
这也是他认为 DeepSeek 的工程突破不会改变 Stargate 的原因。这是OpenAI 与软银和甲骨文在本月早些时候宣布的 5000 亿美元的大型合作伙伴关系,用于 AI 数据中心。
DeepSeek 带来的主要变化是各国承认人工智能是下一个基础设施,就像电力和互联网一样。Midha 希望他们考虑他所称的“基础设施独立”。
他显然在倡导西方国家使用西方模式,比如他位于巴黎的 Mistral。数百家公司对此表示担忧,并已经封锁了 DeepSeek,这既是一个消费者应用服务,也是一个开源模型。
并不是每个人都相信对中国开源模型的恐惧。公司可以在自己的数据中心本地运行它们。而且,DeepSeek 已经作为安全的云服务从像 Microsoft Azure Foundry 这样的美国公司提供,因此开发者不必使用 DeepSeek 的云服务。
事实上,英特尔前首席执行官帕特·基尔辛格——一个对中国非常熟悉的人——告诉 TechCrunch,他的初创公司 Gloo 正在构建基于他们自己版本的 DeepSeek R1 的 AI 聊天服务,而不是选择像 Llama 或 OpenAI 这样的选项。
本文翻译自:TechCrunch,https://techcrunch.com/2025/01/31/mistral-board-member-and-a16z-vc-anjney-midha-says-deepseek-wont-stop-ais-gpu-hunger/
编译:ChatGPT
——-
(文:Z Potentials)