
图片来源: No Priors
Z Highlights
-
AI模型的训练和推理成本在过去18个月内大幅下降,达到180倍的成本降低。这一趋势推动了更多开源项目的涌现。
-
DeepSeek展示了中国在AI领域的快速发展,不仅在推理能力方面赶超部分西方模型,而且通过成本优化展示了令人瞩目的进展。
-
接下来的10年将是AI应用科学的时代,从数字生物学、气候技术到机器人、自动化物流,AI将深刻改变多个行业。
-
AI将持续在垂直领域(如法律、医学记录、客户服务)取得突破,催生更多定制化解决方案。
No Priors是一个AI、创业与创新主题的投资播客节目,由硅谷知名科技投资人Elad Gil和Sarah Guo共同主持。本期为该播客第100期节目,二人内部复盘了近期AI界大事及对未来趋势的看法。
人工智能的最新趋势与行业动态
Sarah:最近几周,人工智能领域的发展令人振奋,我们有很多值得探讨的话题。不如我们从最新的行业动态开始,或者更准确地说,回顾过去一个月的重大新闻。你对此的总体看法如何?
Elad:DeepSeek在某些方面确实意义重大,但从趋势发展的角度来看,它也是预期中会发生的现象之一。我认为,人们之所以对DeepSeek产生浓厚兴趣,主要有三个原因。首先,这是一个最前沿的中国模式,它在推理及其他多个领域逐步赶上了西方模式,表现相当亮眼,并且是开源的。其次,论文提到该模型的训练成本仅为 550 万美元,相对低廉。最后,有关其背后力量和背景的种种猜测使得这款模型增添了几分神秘色彩。
深入分析可以发现,这个最先进的开源模型具备不少最新功能。他们在强化学习方面做了出色的工作,论文中展示了一些新颖的技术。事实上,我注意到其他实验室也在逐渐适应这些技术,尽管一些实验室此前已开发过类似方案,但无疑他们的努力值得肯定。在成本方面,我与多位业内专家讨论后了解到,这类模型的最终训练成本普遍在 500 万至 1000 万美元之间。关键问题在于,他们在提炼出更小模型之前究竟投入了多少工作。我个人判断,整个训练过程可能花费了数亿美元的计算资源。
因此,从成本角度来看,这并不算什么新鲜事,而英伟达股价因这一消息下跌 20%,实在有些过度反应。最后,关于DeepSeek模型的背景,有很多猜测,例如它可能与某对冲基金相关,甚至涉及其他投机性因素。当然,也有可能正如它所声称的那样,只是一个单纯的开源项目。这是我的看法,你怎么看?
Sarah:我认为这一反应确实有些滞后,但在你提到的历史背景下,这也不算意外。比如 GPT-3、GPT-3.5 和 ChatGPT 推出时,市场的反应类似。DeepSeek V3 模型发布于 12 月,然而,英伟达的股价并未因此下跌。这说明市场显然不仅仅关注模型预测下一个词的能力,更在意的是如何通过人类反馈和高质量数据来优化模型,使其更具实用性。
此外,这一事件也可以看作是 20 年来中美科技主导权的缩影。这种“美国遥遥领先,中国能否追赶”的叙事模式在这次事件中被颠覆,证明了中国模式的快速进步。然而,我认为成本是其中一个关键点,可能存在误解或被错误解读。在我看来,规模化的最终模型运行成本很难仅限于这个范围。
正如你所说,实验过程涉及大量工具开发、数据处理、实验管理、预训练、数据生成、后期微调和推理工作。要做到这一点,总成本远超 600 万美元。即便如此,这种成本规模已然突破了传统的入门成本门槛,这才真正引发了市场的震动。
Elad:这其实是意料之中的。若对比现在训练 GPT-4 级别模型的成本和两年前的数据,会发现成本已大幅下降。我们的团队在过去18个月中计算得出,同等级别模型的单位token成本已下降了 180 倍!这不仅是 180% 的提升,而是整整 180 倍的差距,尤其在推理和训练成本上,成本下降显而易见。
Sarah:虽然他们确实在技术上取得了一些突破,但整体来看,这仍是行业发展趋势的自然延伸。我认为他们的成果非常令人瞩目,也推动了开源生态的前进,这非常重要。然而,人们需要从更宏观的角度来审视这些变化。在过去 18 个月里,同等性能的模型成本显著降低。你是否认为这意味着模型正在逐步商品化?
Elad:有一个非常值得推荐的网站,叫做 Artificial Analysis AI,它展示了各种模型在不同基准测试中的相对表现。网站的运营者不仅自行完成基准测试,还会反复验证和重新测试结果。在推理、科学知识、数学运算、编程和多语言支持等方面,模型的表现差距正逐渐缩小。网站提供的图表清楚地展示了各个模型在性能和成本之间的对比。
与 18 个月前相比,如今各家模型在很多领域的差距显著缩小,尽管某些特定领域中仍有明显差距。未来,若有突破性模型问世,可能会在短时间内再次引领市场,但就目前而言,市场正趋于平衡。

图片来源:No Priors
中美技术竞争与模型成本之争
Sarah:那么,你认为成为技术前沿的领导者有何价值?
Elad:我认为有三四种主要价值。首先,占据市场份额至关重要。用户习惯一旦形成,便会对某个模型产生长期依赖,特别是已经为该模型优化了提示和工具的用户。其次,如果你能利用现有模型推动下一个模型的开发,便能显著提升效率。例如,数据标注、合成数据生成以及后期微调等环节都可以从更好的基础模型中受益。
此外,有一种观点认为,当模型的技术越接近突破时,性能提升速度会大幅加快,甚至形成正向循环,使领先者持续保持优势。虽然我无法确定这一观点的准确性,但确实有许多研究人员持这一看法。我们可以从多角度思考这个问题。
Sarah:没错!我想补充一点,如果基础模型足够高质量,并能生成下一代模型所需的合成数据,这将极大地提升模型的可扩展性。这种能力可以大幅度缩小市场中的技术差距。不过,这个话题还没有被深入讨论。谈到前沿技术的价值实现,‘DeepSeek’ 移动应用曾一度成为应用商店中的热门下载。我认为市场上的用户能够辨别出“最具性价比的模型”,这也推动了用户的积极采用。与此同时,也有观点认为人们只是想试试看中国的 AI 模型是否能媲美 OpenAI 和 Anthropic 的产品。
Elad:说到近期的技术进展,OpenAI 最近发布了深度研究产品,同时宣布了“Stargate”项目——这是与白宫合作进行的一系列大规模 AI 基础设施投资计划。你怎么看这些进展?
Sarah:深度研究是一款非常有意思的产品,我建议大家都去试试。对我来说,它极大地提升了知识工作的门槛。过去,或许我会雇佣一名中等水平的实习生或分析师来完成某些工作,而现在我更倾向于让深度研究来完成这些任务,效果甚至更好。我想,这种模式未来会被广泛采用。当然,这款工具在我不太熟悉的领域还有改进空间。它可以为我提供广泛的视角,帮助我识别专家,并确保对新领域有足够的理解。然而,在一些我熟悉的领域,我发现它偶尔会产生误导性的结果,需要进一步审核和验证。
Elad:这种情况让我想起一个叫“Murray Gell-Mann 失忆症”的现象。它的名字源自物理学家 Murray Gell-Mann,由作家 Michael Crichton 提出。当你在报纸上读到一篇关于你熟悉领域的文章时,你可能会觉得这篇文章漏洞百出。但当你阅读不熟悉领域的内容时,却会下意识地认为它一定是准确的。这种认知偏差非常有趣,同时也提醒我们在使用 AI 工具时要保持批判性思维。
这不仅仅是一个心理现象,它在未来如何影响人们使用 AI 的方式至关重要。随着 AI 逐渐成为主要信息来源,我们需要更透明的方式来追溯信息的真实来源。目前,很多团队都在努力解决这一问题,但它确实对现代知识获取和人工智能agent的使用产生了深远影响。
Sarah:从用户体验的角度来看,我不确定如何彻底解决这一问题。也许它部分反映了网络信息本身的不完备性,这让我们无法准确判断某些信息的可靠性。
Elad:这种现象从宣传和信息控制的角度来看尤其危险。我们可以将社交网络视为 V1 版本的传播工具,而现代 AI 则是更加强大的 V2。如今,AI 技术汇聚了 Google、Twitter、Facebook 等多种功能于一身,成为一个统一的信息源。这使得对 AI 输出结果的控制具有极高的影响力,但也极具风险。这也是我为什么对多 AI 生态和开源系统充满信心,因为它们在一定程度上能平衡这种信息垄断现象。
Sarah:“星际之门”项目中,隐含了几个重要问题。首先,保持领先的基础设施有多重要?其次,资本市场能否持续为这些项目提供资金?最后,主权国家或准主权实体在这些项目中的角色是什么?我更倾向于认为,在这些项目中,不确定性往往比风险本身更重要。如果你认为技术能力是新兴的,且算法效率与数据规模存在交互,那么很难准确预测下一步的发展。不过,可以肯定的是,任何一家试图构建 AGI 的大型研究实验室都不会拒绝拥有更大计算集群的机会,尤其是当资金充足时。
我们在预测未来时总会面临不确定性,不过,既然这是第 100 集节目,我们就大胆预测一下 2025 年的技术趋势吧!
技术突破与未来趋势预测
Elad:哈哈,新年快乐!虽然现在已经是二月了,但我们还是可以提前说“情人节快乐”!我觉得 2025 年将会发生几件重要的事情。首先,基础模型市场将会经历部分整合,尤其是在图像生成、视频、语音等领域。未来,这些领域或将迎来新一轮的市场重组。我们还会看到物理学、生物学、材料科学等交叉领域的快速扩展,伴随着推理能力和通用基础模型的进一步发展。
第二个大趋势是垂直领域的 AI 解决方案将大规模普及。我们已经看到 Harvey 在法律领域的应用,Sierra 在客户成功管理方面的布局,Codegen 和医疗记录工具也在快速崛起。这些垂直 AI 产品将越来越多地集成智能代理功能,推动行业变革。
第三,自动驾驶技术将再次成为焦点。Tesla 和 Waymo 早已在机器人出租车和全自动驾驶领域取得显著进展。与此同时,一些较小的公司也将成为黑马,推动自动化技术的边界。
第四,我认为消费者技术领域将迎来大规模实验。虽然过去几年我们很少见到消费者产品的大规模创新,但未来这种情况可能会发生改变。越来越多的初创公司将进入这一领域,带来前所未有的消费者体验。
最后,我们或许会在智能agent和早期机器人技术领域看到一些激动人心的发展。虽然这些技术仍处于起步阶段,但它们将为我们揭示未来可能的工作模式和生活方式。因此,我的 2025 年五大预测是:基础模型市场整合、垂直 AI 运营崛起、自动驾驶回归焦点、消费者产品复苏以及早期机器人技术萌芽。你怎么看?
Sarah:我非常同意你的观点。尤其是在智能agent的定义越来越模糊的情况下,我们会看到多步骤任务执行能力的显著提升。推理模型的进步和产品公司的垂直整合将使这些技术应用更加广泛。更有趣的是,随着低延迟、小型化的 AI 模型不断涌现,未来我们将看到更多本地化运行的可能性。这不仅会提升用户体验,还会极大地推动消费者应用的发展。
Elad:是啊!今年或许会是健康领域迎来突破性进展的一年。我们已经看到许多新型生物技术创新,而 AI 数据生成策略将为这一领域带来更多可能性。
Sarah:最后一个问题:如果到了我们第 200 集时,你觉得 AI 技术会发展到什么程度?
Elad:我想,那时候我们可能已经不是节目的主角了。未来可能会有更先进的 AI 来主持这档节目,而我们将成为网络中的节点,静静观察这些变化。
Sarah:是啊,而且它们或许会比我们更帅、更聪明!
原视频:No Priors Ep. 100 | With Sarah and Elad
https://www.youtube.com/watch?v=YH7cHLPea-c
编译:Asti Gao
请注意,本文编译自文末载明的原始链接,不代表Z Potentials立场。如果您对本文有任何想法或见解,欢迎在评论区留言互动探讨。
Z Potentials将继续提供更多关于人工智能、机器人、全球化等领域的优质内容。我们诚邀对未来充满憧憬的您加入我们的社群,与我们共同分享、学习、成长。
(文:Z Potentials)