喝点VC|Greylock:我们处于DeepSeek时刻

图片来源:Greylock

在快速发展的人工智能世界中,DeepSeek-R1 的到来标志着一个关键的转折点。

我们联系了 Greylock 投资组合中五家领先的 AI 基础设施公司的创始人——Devvret Rishi(Predibase)、Tuhin Srivastava(Baseten)、Ankur Goyal(Braintrust)、Jerry Liu(LlamaIndex)和 Alex Ratner(Snorkel AI)——以了解他们对 DeepSeek 的看法,以及它对开源与封闭模型、AI 基础设施和生成 AI 经济的未来意味着什么。他们的见解显示出对 DeepSeek 带来的进展的广泛热情,但在其现实世界影响方面存在一些观点的分歧。

开源模型与闭源模型:竞争环境已趋平衡

历史上,像 OpenAI 这样的闭源模型在很大程度上领先于开源替代品,通常领先 6 到 12 个月。DeepSeek-R1 从根本上缩小了这一差距,在关键推理基准上展示了与 OpenAI 最新产品相当的性能,尽管其占用空间更小。

根据 Rishi 的说法,“DeepSeek-R1 是开源 AI 的一个分水岭时刻。历史上,开源模型落后于像 OpenAI 这样的闭源模型 6 到 12 个月。现在,DeepSeek-R1 基本上缩小了这一差距,并在关键推理基准上与 OpenAI 的最新模型相当,尽管其占用空间更小。”他认为这是开源开始商品化模型层的拐点。

Srivastava 表达了这一观点,称:“DeepSeek 作为一个时刻改变了一切。一个开源模型的质量与 SOTA 封闭源模型处于同一水平,这在以前并非如此。现在真相大白,所有的开源模型如 Llama、Qwen 和 Mistral 将很快跟上。”

Goyal 提供了一个更为平衡的观点:“DeepSeek 是 O1 风格(推理)模型的‘LLaMa 时刻’。在最坏的情况下,这意味着秘密公式已经公开,我们将拥有一个充满活力和竞争的大模型市场,就像我们为 GPT、Claude 和 LLaMa 风格模型所做的那样。在最好的情况下,工程团队将拥有大量实用选项,每个选项都有计算、成本和性能的权衡,使他们能够解决各种各样的问题。在所有情况下,我认为世界都将从这一进展中受益。”

Ratner 对开源和模型多样性的看法与上述观点一致,强调这代表着专注于自身 AI 的企业的巨大加速:“我们一直认为开源模型紧随其后——算法和模型架构很少会长时间隐藏。只是时间问题。  然而:这突显了一个令人兴奋的现实,即企业将拥有大量高性能的廉价 LLM 选项,以便根据他们的数据和专业知识进行评估和专业化,满足他们独特的用例。我预计 DeepSeek 将大幅加速这一专门化企业 AI 的趋势。”

AI 基础设施与开发者采纳:强化学习革命

DeepSeek-R1 最引人注目的方面之一是它使用强化学习(RL)来提高推理能力。虽然基于 RL 的LLM优化已经研究多年,但 DeepSeek 是第一个成功在大规模上实现并取得可测量收益的开源模型,使用了一种称为带策略优化的广义强化学习(GRPO)技术。

Rishi 将其视为一个改变游戏规则的因素,他解释道:“DeepSeek 最具影响力的贡献是证明纯强化学习可以引导高级推理能力的提升,这在他们的 R1-Zero 模型中得到了体现。”然而,他也指出了一个主要的缺口:“大多数机器学习团队从未训练过推理模型,而今天的人工智能工具并不是为了支持这一新范式而构建的。”

Srivastava 认为 DeepSeek 标志着 AI 基础设施的一个转折点:“有了 DeepSeek,‘我们训练了最大的最好的模型,所以我们保持封闭’的护城河不复存在。现在,你有一个情况,前沿模型级别的质量可以在一个你完全控制的模型中获得。”

Ratner补充道:“我们正在看到受限、可验证领域(例如数学、基础编码——这些简单且易于检查正确性的事物)的‘AlphaGo 时刻’,展示了LLMs + RL 的强大力量,以及算法进步的快速传播。”然而,他强调,下一步将涉及将这一成功扩展到更复杂和不易验证的领域——这将是一个更长且更具挑战性的旅程,需要更多的人类智慧和投入。

新应用:大规模人工智能推理

DeepSeek 改进的推理能力开启了一波新的应用。Rishi 强调了几个新兴的可能性,包括:

  • 自主 AI Agent 随着时间的推移不断完善其决策能力。
  • 高度专业化的规划系统在金融、物流和医疗等行业中。
  • 企业人工智能助手能够动态适应用户需求,超越僵化的基于 RAG 的解决方案。
  • 基于 AI 的自我调试和根据性能反馈优化代码的软件工程工具。

Liu 对此进行了扩展,讨论了对 GPU 需求和自主应用的影响:“DeepSeek 并不意味着对 GPU 算力的需求会减少;相反,我非常兴奋,因为我认为这将显著加速自主应用的需求和采用。构建任何‘真正有效’ Agent 核心问题之一是可靠性、速度和成本——能够端到端自动化知识工作流的强大代理应用需要反复进行LLM推理调用的推理循环。Agent 越通用/能力越强,它所需的推理循环就越多。虽然 O1/O3 系列模型具有令人印象深刻的推理能力,但它们的成本过于高昂,无法用于更通用的 Agent。更快/更便宜的模型激励开发能够解决更多任务的更通用的 Agent,这反过来又导致更多人和团队对其的需求和采用。”

Srivastava 强调:“DeepSeek 及其后续模型对高度监管的行业有重大影响。拥有严格数据合规要求的公司将能够更自由地进行实验和创新,因为他们知道可以完全控制数据的使用方式和发送地点。”

Ratner 强调数据仍然是关键:“R1 风格的进展依赖于在相关领域的强大预训练/后训练和严格的评估数据,然后强化学习的魔法才能发挥作用。”他进一步解释道:“今天的生成人工智能中的许多事情实际上归结为高质量的领域特定标注,包括强化学习。DeepSeek 的结果重申了这一观点:如果你有一个好的标注方法(即一个‘奖励函数’),你就可以创造奇迹;但在大多数领域,获取数据或进行标注并不是那么容易。

生成性人工智能的经济学:成本方程的变化

DeepSeek 加速了向更便宜、更高效的推理和后训练的趋势,显著改变了生成式人工智能部署的经济学。

Rishi 指出杰文斯悖论:“随着大模型变得更便宜和更高效,企业不仅会用开源模型替代专有 API——他们还会更加使用 AI,微调和部署多个特定领域的模型,而不是依赖单一的通用模型。”

Srivastava 强调了财务影响,表示:“像 R1 这样的推理模型将比使用 OpenAI 或 Anthropic 便宜多达 7 倍。拥有这样经济性的模型可以解锁许多以前可能在财务上不可行或对大多数企业不具吸引力的用例,而这些用例尚未在生成 AI 中有意义地上线。”

Ratner 补充道:“随着生成器变得越来越强大和商品化——一切都与标签有关!无论是 RLHF、像 DeepSeek-R1 的奖励函数这样的启发式方法,还是先进的混合方法,定义接受函数以匹配我们想要的分布是合乎逻辑的下一步。”

DeepSeek 无疑是人工智能行业的一个里程碑,标志着开源模型首次达到了与专有替代品真正的竞争平衡。Rishi 和 Srivastava 将其视为根本性的转变,开启了一个新的人工智能发展时代,在这个时代,公司可以完全控制高性能模型,同时享受开源带来的经济优势。然而,Goyal 对其在现实世界中的采用仍持怀疑态度,认为它更像是对现有企业的定价杠杆,而不是一个立即的替代品。

Ratner 强调,尽管 DeepSeek 代表了重要的进展,但未来人工智能的很大一部分依赖于高质量的特定领域数据和标注。他总结道:“无论你将其视为范式转变还是人工智能军备竞赛中的另一步,其对行业的影响都是不可否认的。”

本文翻译自:Greylock,https://greylock.com/greymatter/the-deepseek-moment/

编译:ChatGPT


——-

(文:Z Potentials)

欢迎分享

发表评论