

“AI正处于拐点之中。“
作者|赵健 苏霍伊
编辑|王博
发自美国圣何塞
AI行业的“超级碗”开始了,今天的主角是黄仁勋。
为了这个穿着黑色皮衣的男人,来自全球各地的科技行业创业者、从业者、开发者、科学家、投资人,还有英伟达的客户、合作伙伴以及媒体都汇聚在圣何塞这座小城。
黄仁勋在GTC 2025的演讲开始时间是当地时间3月18日上午10点,但是清晨6点,Doges AI创始人亚伯拉罕·戈麦斯(Abraham Gomez)就赶到了SAP Center,只为能“抢到一个前排的好位置”,当时他排在全场第二。而到了早上8点,场馆外队伍已经排出了一公里。
音乐生成模型公司Wondera联合创始人兼CEO Bill坐在观众席第一排,他特意穿着一件黑色皮衣,“只为致敬老黄”。
虽然现场观众热情高涨,但黄仁勋并没有像去年那样——如同一个“摇滚明星”让人异常狂热。
他今年更想证明自己的判断,证明英伟达路线没有问题,他全场说得最多的词之一就是“scale up(扩大规模)”。
去年GTC,黄仁勋认为“未来是生成的”;而今年GTC,黄仁勋认为“AI正处于拐点之中”。
这次,黄仁勋主要发布了三个方面的内容:
第一,Blackwell GPU已全面投入生产。“产量增长令人难以置信,客户需求也令人难以置信,”黄仁勋表示,“理由很充分,AI正处于拐点之中,由于推理人工智能以及推理人工智能系统和 Agentic 系统的训练,我们在人工智能中需要进行的计算量要大得多。”
第二,搭载AI推理加速软件Dynamo的Blackwell NVLink 72可提供NVIDIA Hopper 40倍的AI工厂性能。黄仁勋说:“随着我们扩展AI,推理将成为未来十年最重要的工作负载之一。”而在介绍Blackwell Ultra的强劲性能时,黄仁勋又说出了那句经典台词:“买得越多,省得越多。甚至比这更好——买得越多,赚得越多。”
第三,英伟达制定年度路线图,希望引导全球企业、开发者围绕其规划AI基础设施。英伟达正在构建三个AI基础设施,分别用于云、企业和机器人。
此外,英伟达还发布了两款新的GPU:一是Blackwell Ultra GB300,这是去年发布的Blackwell的升级产品;二是全新一代的芯片架构Vera Rubin以及Rubin Ultra。
黄仁勋对Scaling Law的信仰背后的秘密,就藏在历经十几代架构的芯片里。
总体而言,黄仁勋的演讲一直在围绕着“大模型推理的极限计算”。
在AI推理中,从单一用户到大规模部署,需要在性能与收益之间找到最佳平衡。系统既要确保用户的快速响应,又要通过提升硬件(如FLOPS、HBM带宽)和优化软件(如架构、算法)来提高整体吞吐量(Tokens per Second),以最大化规模化推理的经济价值。
关于Scaling Law放缓的问题,黄仁勋也提出了跟业内截然相反的观点,他认为:“由于新兴的扩展方法和技术,人工智能的改进速度比以往任何时候都快。”
黄仁勋最近的压力并不小,在直播画面之外,他在现场演讲间隙多次喝水,演讲最后,嗓音也略显沙哑。
AI市场正从“训练”转向“推理”,AMD、英特尔、谷歌、亚马逊等科技巨头推出专用推理芯片降低对英伟达的依赖。同时Cerebras、Groq、Tenstorrent等初创企业加速布局AI加速器,而DeepSeek等AI公司则希望通过优化模型减少对昂贵GPU的需求。
这正是黄仁勋的压力来源。
英伟达在训练市场占据超过90%的份额,随着推理领域竞争越来越激烈,黄仁勋自然不想把推理市场拱手相让,正如会场入口标语:AI的下一站是什么?从这里开始。
以下是黄仁勋主题演讲的重点内容,由「甲子光年」在GTC现场整理。
1.全世界都误解了Scaling Law

人工智能是英伟达近十年崛起的时代机遇。对于AI的前景,黄仁勋笃信不疑。本次GTC,黄仁勋一开场就将今年1月在CES上演讲时用到的两张PPT带观众温习了一遍:
第一张是AI的发展迭代进程,黄仁勋将其分为Perception AI(感知AI)、Generative AI(生成AI)、Agentic AI(代理AI)、Physical AI(物理AI)四大阶段。
第二张是Scaling Law的三个阶段,黄仁勋将其总结为Pre-training Scaling(预训练扩展)、Post-training Scaling(后训练扩展)、Test-time Scaling / Long Thing(测试时间扩展/长思考)。
关于Scaling Law,黄仁勋提出了跟业内截然相反的观点。他声称,几乎“全世界都误解了”Scaling Law放缓的问题。黄仁勋认为,事实上由于新兴的扩展方法和技术,人工智能的改进速度比以往任何时候都快。
黄仁勋是坚定的Scaling Law的“信仰者”,这种信仰建立在全世界人工智能的发展,都牢牢绑定于英伟达的GPU业务的基础上。
黄仁勋随后概述了能“一步步”推理的AI的发展,并提到了推理和强化学习的需求如何推动人工智能计算的需求。随着人工智能正经历一个“拐点”,四大云服务提供商对GPU的需求正在激增。黄仁勋预计数据中心建设的价值将达到1万亿美元。
黄仁勋解释道,NVIDIA CUDA-X GPU加速库和微服务现在服务于每个行业。未来每家公司都会拥有两家工厂:一家生产产品,一家生产AI。
AI目前正在走向世界,涉足机器人、自动驾驶汽车、工厂和无线网络领域。黄仁勋表示,AI最早涉足的行业之一是自动驾驶汽车。他补充道:“我们开发的技术几乎被每一家自动驾驶汽车公司使用”,无论是在数据中心还是汽车领域。
黄仁勋宣布了自动驾驶的一项重要进展:美国最大的汽车制造商通用汽车正在采用 NVIDIA AI、模拟和加速计算来开发下一代汽车、工厂和机器人。他还宣布推出NVIDIA Halos,这是一款综合安全系统,将NVIDIA的汽车硬件和软件安全解决方案系列与其在AV安全领域的尖端AI研究结合在一起。
接下来是数据中心和推理。
黄仁勋谈到了数据中心,他提到NVIDIA Blackwell已全面投入生产,并分享了来自众多行业合作伙伴的系统。
对此黄仁勋心里美滋滋的,他还介绍了Blackwell如何支持极端扩展,“我们想这样做的原因是为了解决一个极端问题,这就是所谓的推理。”
他解释道,推理就是生成token,这对企业至关重要。生成这些token的人工智能工厂必须以极高的效率和性能建造。随着最新一代推理模型能够思考和解决日益复杂的问题,对token的需求只会增长。
为了进一步加速大规模推理,黄仁勋发布了NVIDIA Dynamo,这是一款用于加速和扩展AI工厂中AI推理模型的开源软件。“它本质上是AI工厂的操作系统。”黄仁勋说。
2.老黄好刀法:“买得越多,省得越多,赚得越多”

英伟达还发布了两款新的GPU:一是Blackwell Ultra GB300,这是去年发布的Blackwell的升级产品;二是全新一代的芯片架构Vera Rubin以及Rubin Ultra。
Blackwell Ultra GB300将于今年下半年出货,Vera Rubin将于明年下半年出货,Rubin Ultra将于2027年下半年推出。
同时黄仁勋还公布了接下来的芯片路线图,其下下一代芯片的架构已经被命名为Feynman,将于2028年问世。该名字可能以著名理论物理学家理查德·费曼(Richard Feynman)命名。
英伟达每一代GPU架构,都会采用著名科学家的名字来命名。Blackwell是英伟达在去年GTC发布的新架构,以美国统计学家David Harold Blackwell来命名。今年发布的最新一代架构Rubin,是以“证实暗物质存在”的女性科学先驱薇拉・鲁宾(Vera Rubin)来命名。
从2004年至今的十一年时间里,英伟达已经发布了十三代芯片架构,包括Currie(居里)、Tesla(特斯拉)、Fermi(费米)、Kepler(开普勒)、Maxwell(麦克斯韦)、Pascal(帕斯卡)、Volta(伏特)、Turing(图灵)、Ampere(安培)、Ada Lovelace(阿达·洛芙莱斯)、Hopper(霍珀)、Blackwell(布莱克威尔),以及今天的Rubin(鲁宾),平均一年发布一代多。
黄仁勋对Scaling Law的信仰背后的秘密,就藏在这十几代架构的芯片里。
Blackwell Ultra是去年发布的Blackwell的升级版,但黄仁勋并没有直接对比两者的性能。英伟达曾向媒体透露,单个Ultra芯片将提供与Blackwell相同的20 petaflops的AI性能,但HBM3e内存从192GB升级到了现在的288GB。与此同时,一个Blackwell Ultra DGX GB300“超级集群”将提供与Blackwell版本相同的288个CPU、576个GPU和11.5 exaflops的FP4计算能力,但内存容量为从240TB升级到300TB。
英伟达一直将Blackwell Ultra与2022年发布的H100做对比。
根据官方数据,Blackwell Ultra提供了1.5倍的FP4推理能力,可显著加快“AI推理”,NVL72集群能够运行一个交互式的 DeepSeek-R1 671B模型,只需十秒就能提供答案,而H100则需要1.5分钟。英伟达表示,这是因为Blackwell Ultra每秒可以处理1000个token,是H100的十倍。
英伟达还将提供一个名为GB300 NVL72的单机架,该机架提供1.1 exaflops的FP4、20TB的HBM内存、40TB的“快速内存”、130TB/秒的NVLink带宽和14.4 TB/秒的网络。
由于Blackwell Ultra相比H100的压倒性优势,黄仁勋显然也担心客户不再为H100买单,也担心自己的销售人员还卖不卖的出去H100。他调侃自己是“首席收入破坏者”,并表示在某些情况下,Hopper芯片其实也“还行”,但又补充道“情况并不多”。
接下来,黄仁勋说出了那句经典台词:“买得越多,省得越多。它甚至比那更好。现在,买得越多,赚得越多。”
英伟达的下一代架构Rubin是一个全新架构。黄仁勋说,“基本上,除了机架外,所有东西都是全新的。”
Rubin的FP4算力达到50千万亿次,高于Blackwell的20千万亿次浮点运算。Rubin Ultra将采用单芯片,该芯片实际上包含两个连接在一起的Rubin GPU,其性能达到100千万亿次FP4,是前者的两倍,同时内存接近四倍,达到1TB。
完整的NVL576 Rubin Ultra机架可提供15 exaflops的FP4推理和5 exaflops的FP8训练,英伟达称其性能是今年推出的Blackwell Ultra机架的14倍。
如何在芯片之上扩展到更大的系统?黄仁勋提到将光子学(一种依靠光而不是电信号传输数据的网络技术)紧密集成到加速计算基础设施中。英伟达发布的Spectrum-X和NVIDIA Quantum-X硅光子网络交换机融合了电子电路和光通信,使AI工厂能够跨站点连接数百万个GPU,同时降低能源消耗和运营成本。
“这真是一项疯狂的技术。”黄仁勋说道。与传统方法相比,英伟达光子交换机集成了光学创新技术,激光器数量减少了4倍,从而实现了3.5倍的功率效率、63倍的信号完整性、10倍的大规模网络弹性和1.3倍的部署速度。
3.AI时代的计算机

除了云端芯片与数据中心外,英伟达还推出了搭载NVIDIA Grace Blackwell平台的DGX个人AI超级计算机,让AI开发人员、研究人员、数据科学家和学生能够在桌面上对大型模型进行原型设计、微调和推理。
黄仁勋将其描述为“完美的圣诞礼物”,并同时推出了DGX Spark(前身为Project DIGITS)和DGX Station,后者是一款搭载NVIDIA Blackwell Ultra平台的全新高性能NVIDIA Grace Blackwell桌面超级计算机。用户可以在本地运行这些模型,也可以将它们部署在NVIDIA DGX Cloud或任何其他加速云或数据中心基础设施上。
“这是AI时代的计算机。”黄仁勋说。
华硕、戴尔和惠普将与Boxx、Lambda和Supermicro一起销售台式电脑版本。
面向AI agent,黄仁勋还发布了具有推理能力的开源Llama Nemotron模型系列,为开发人员和企业提供一个业务就绪的基础,创建独立工作或作为连接的团队解决复杂任务的高级AI agent。
NVIDIA Llama Nemotron推理系列基于Llama模型,提供按需人工智能推理功能。英伟达在培训后增强了新的推理模型系列,以改进多步骤数学、编码、推理和复杂的决策。
这一改进过程使模型的准确率较基础模型提升高达20%,推理速度较其他领先的开放推理模型提升5倍,推理性能的提升意味着模型可以处理更复杂的推理任务,增强决策能力,降低企业的运营成本。
领先的Agentic AI平台先驱——包括埃森哲、Amdocs、Atlassian、Box、Cadence、CrowdStrike、德勤、 IQVIA、微软、SAP和ServiceNow——正在与 NVIDIA 合作开发其新的推理模型和软件。
4.通用机器人时代已经到来

黄仁勋将机器人描述为下一个价值10万亿美元的产业,并表示到本世纪末,全球将至少缺少5000万名工人。英伟达提供了一套完整的技术,用于训练、部署、模拟和测试下一代机器人技术。
黄仁勋在一段视频中宣布推出英伟达Isaac GR00T N1,这是世界上第一个开放、完全可定制的通用人形推理和技能基础模型。他表示:“通用机器人时代已经到来。借助英伟达Isaac GR00T N1和新的数据生成和机器人学习框架,世界各地的机器人开发人员将开辟人工智能时代的下一个前沿。”
英伟达还宣布发布全新Cosmos世界基础模型,为物理AI开发引入开放且完全可定制的推理模型,并赋予开发人员对世界生成前所未有的控制权。
黄仁勋表示:“使用Omniverse来调节Cosmos,并使用Cosmos来生成无限数量的环境,使我们能够创建有根有据、由我们控制,但同时又系统地无限的数据。”
他还介绍了与谷歌DeepMind和迪士尼研究中心共同开发的用于机器人模拟的Newton开源物理引擎,然后,一个名叫“蓝色”的微型机器人从地板上的一个舱口钻出来,向黄仁勋发出嘟嘟声。
这个小家伙去年GTC就来过黄仁勋演讲现场,今年它再次成功吸引了全场的目光,大家都纷纷拿出手机拍摄。
英伟达的发展史,就是不断为其GPU寻找应用场景的历史。在十多年前,黄仁勋通过AlexNet找到了人工智能。而今天,黄仁勋为英伟达下一个十年寻找的场景,就是机器人与物理AI。
这一次,英伟达还能得偿所愿吗?
但黄仁勋显然信心满满,会场内回荡的一首歌曲似乎就是黄仁勋的内心独白:
I’ll put my armor on show you how strong I am
我会全副武装让你看看我有多坚强
I’ll put my armor on I’ll show you that I am
我会严阵以待让你看看我
I’m unstoppable
我势不可挡
(封面图及未标注图片来源:英伟达及「甲子光年」拍摄)

(文:甲子光年)