
在快速发展的 AI 世界中,DeepSeek-R1 的到来标志着一个关键转折点。
我们联系了 Greylock 投资组合中五家领先 AI 基础设施公司的创始人——Devvret Rishi(Predibase)、Tuhin Srivastava(Baseten)、Ankur Goyal(Braintrust)、Jerry Liu(LlamaIndex)和 Alex Ratner(Snorkel AI)。
以获取他们对 DeepSeek 的看法,以及它对开源与闭源模型、AI 基础设施和生成式 AI 经济学的未来意义。他们从不同角度,表达了目前市场对 DeepSeek 的热情,同时对其实际产生的影响,持有不同的观点。
开源与闭源模型:竞争格局已趋于平衡
OpenAI 等专有模型曾一度领先于开源替代品,但 DeepSeek-R1 已缩小差距,在关键推理基准测试中与 OpenAI 最新模型持平,尽管其规模更小。
据 Rishi 称,“DeepSeek-R1 是开源 AI 的一个分水岭。历史上,开源模型比 OpenAI 等专有模型落后 6-12 个月。如今,DeepSeek-R1 基本上已经缩小了这一差距,并在关键推理基准测试中与 OpenAI 的最新模型持平,尽管其规模更小。”他认为这是开源将模型层商品化的转折点。
Srivastava 对此表示赞同,并说道:“DeepSeek 作为一个转折点改变了一切。开源模型在质量上已与最先进的闭源模型持平,这在以前是不可想象的。如今秘密已被揭开,像 Llama、Qwen 和 Mistral 这样的开源模型很快都会跟上步伐。”
Goyal 提供了一个更为平衡的视角:“DeepSeek 对于 O1 风格(推理)模型而言,是‘LLaMa 时刻’。在最坏的情况下,这意味着秘密配方已公开,我们将拥有一个充满活力且竞争激烈的LLM市场,就像我们在 GPT、Claude 和 LLaMa 风格模型中所经历的那样。
最好的情况下,工程团队将拥有多样化的实用选项,每个选项在计算能力、成本和性能之间都有权衡,使他们能够解决极其广泛的问题。无论如何,我认为世界都将从这一进步中受益。”
Ratner 呼应了上述关于开源和模型多样性的观点,强调这为企业加速定制自己的 AI 提供了巨大动力:“我们一直认为开源模型紧随其后——算法和模型架构很少能长期保密,这只是时间问题。
然而,它突显了一个激动人心的现实,即企业将拥有大量高性能且成本低廉的LLM选项。随后可以根据其数据和专业知识进行评估和定制,以满足其独特的使用场景。我预计 DeepSeek 将极大地加速这一企业 AI 定制化的趋势。”
AI 基础设施与开发者使用:强化学习革命
DeepSeek-R1 最引人注目的特点之一是利用强化学习(RL)来提升推理能力。尽管基于 RL 的LLM优化已探索多年,但 DeepSeek 是首个成功大规模实施并取得可测量增益的开源模型,其采用了一种名为广义策略优化强化学习(GRPO)的技术。
Rishi 将这一突破视为游戏规则的改变者,他解释道:“DeepSeek 最具影响力的贡献在于证明了纯粹的强化学习能够激发高级推理能力,正如他们的 R1-Zero 模型所展示的那样。”
然而,他也指出了一个主要差距:“大多数机器学习团队从未训练过推理模型,而当前的人工智能工具并未构建以支持这一新范式。”
Srivastava 认为,DeepSeek 标志着 AI 基础设施的一个转折点:“有了 DeepSeek,‘我们训练了最大最好的模型,所以我们将其封闭’的护城河已不复存在。现在,前沿模型在一个你完全掌控的模型中得以实现。”
Ratner 补充道:“我们正在见证可验证领域(如数学、基础编码——这些简单且定义明确以便检查正确性的事物)的‘AlphaGo 时刻’。展示了LLMs与强化学习(RL)的力量,以及算法进步的迅速传播。”
然而,他强调下一步将是将这一成功扩展到更复杂、验证难度更大的领域——这是一段更为漫长且充满挑战的旅程,需要更多人类的智慧与投入。
新应用:大规模 AI 推理
DeepSeek 增强的推理能力开启了一波新的应用浪潮。Rishi 强调了几个新兴的可能性,包括:
随着时间的推移不断优化决策的自主 AI 代理。
高度专业化的规划系统,应用于金融、物流和医疗等行业。
超越僵化 RAG 解决方案、动态适应用户需求的企业 AI 助手。
基于 AI 的软件工程工具,能够根据性能反馈自我调试和优化代码。
刘进一步讨论了这对 GPU 需求和代理应用的影响:“DeepSeek 并不意味着对 GPU 计算的需求会减少;相反,因为我认为它将显著加速代理应用的需求和采用。
构建任何‘真正有效’的代理的核心问题之一是可靠性、速度和成本——能够端到端自动化知识流程的强大代理应用,需要反复进行LLM推理调用的推理循环。代理通用能力越强,所需的推理循环就越多。虽然 O1/O3 系列模型具有令人印象深刻的推理能力,但对于更通用的代理来说,它们的成本过高。更快/更便宜的模型激励了能够解决更多任务的更通用代理的开发,这反过来又会导致更多人及团队的需求和采用。”
Srivastava 强调:“DeepSeek 及其后续模型对高度监管行业有着重大影响。那些对数据合规性有严格要求的公司,将能够更自由地进行实验和创新,因为他们知道可以完全控制数据的使用方式和发送目的地。”
Ratner 强调,数据仍然是真正的优势:“R1 式的进展依赖于在相关领域进行强有力的前/后训练,以及在强化学习发挥作用之前严格的评估数据。”他进一步解释道,“今天 GenAI 中的许多事情实际上都归结为真正高质量的、特定领域的标注,包括强化学习。DeepSeek 的结果重申了这一点,即如果你有一种好的标注方法(即‘奖励函数’),你可以创造奇迹;但在大多数领域,获取数据或对其进行标注并不那么容易。”
GenAI 经济学:成本等式之变
DeepSeek 加速了推理和训练后成本更低、效率更高的趋势,显著改变了 GenAI 部署的经济性。
Rishi 提到了杰文斯悖论:“随着LLMs变得越来越便宜和高效,企业不仅仅会用开源模型替代专有 API——它们还会更多地使用 AI,微调并部署多个特定领域的模型,而不是依赖单一的通用模型。”
Srivastava 强调了财务影响,他表示:“像 R1 这样的推理模型将比使用 OpenAI 或 Anthropic 便宜多达 7 倍。拥有这种经济性的模型解锁了许多以前对大多数企业来说可能在经济上不可行或没有吸引力的案例,这些企业尚未有效地在生成式人工智能领域上线。”
Ratner 补充道:“随着生成器变得更强大和商品化——关键在于标注。无论是 RLHF、DeepSeek-R1 的奖励函数等启发式方法,还是先进的混合方法,定义接受函数以匹配我们期望的分布是合乎逻辑的下一步。”
DeepSeek 无疑是 AI 行业的一个里程碑,标志着开源模型首次真正达到了与专有替代品竞争的水平。Rishi 和 Srivastava 将其视为一次根本性的转变,开启了 AI 发展的新时代,企业能够完全掌控高性能模型,同时享受开源带来的经济优势。然而,Goyal 对其在现实世界中的采用仍持怀疑态度,认为它更像是针对现有企业的定价杠杆,而非即刻的替代品。
Ratner 强调,尽管 DeepSeek 代表了有意义的进展,但 AI 的未来在很大程度上取决于高质量、特定领域的数据和标注。他总结道:“无论你将其视为范式转变还是 AI 军备竞赛中的又一步,它对行业的影响都是不可否认的。”
本文翻译自:greylock
编译:ChatGPT
(文:Z Potentials)