
作者:李宝珠 & 椰椰
编辑:十九
转载请联系本公众号获得授权,并标明来源
北京时间 3 月 19 日凌晨 1 点,黄仁勋在 GTC 2025 大会上带来主题演讲,除了重磅的 AI 芯片及架构更新外,还发布了多项 Physical AI 新成果,并且开源。
北京时间 3 月 18 日,已经升格为 AI 行业盛会的 NVIDIA GTC 2025 拉开序幕,但或许是因为缺乏重磅产品的「炸场」, 首日的线下论坛与展览并未扭转英伟达股价的颓势,甚至仍出现了下跌。因此,本就万众瞩目的「主题演讲」更是被寄予了更多关注与期望。
诚然,英伟达股价的波动除了与 DeepSeek 引发的「算力需求下降」猜想有关,也或多或少受到了美股大盘回调的影响。但无论是何原因,作为公司掌舵人的黄仁勋都需要尽快重振投资者信心。正因如此,我们看到了他在近 3 小时的演讲中:
* 多次提到了 Scaling Law;
* 加入开源行列,发布基于 Llama 模型构建的 NVIDIA Llama Nemotron 推理模型;
* 大呼 Blackwell 已全面投入生产,且「产能爬坡速度惊人,客户需求同样令人瞩目」;
* 明确强调,由于推理模型的出现,AI 领域的「计算量大幅增加」;
* ……
但老黄的激情演讲似乎收效甚微,截至发稿,英伟达的股价仍在走下坡路。
从某种意义上讲,这也说明了早已被爆料的硬件及架构更新并未获得市场过多青睐,而除 Blackwell Ultra、Vera Rubin 之外,黄仁勋在最后半小时分享的 Physical AI 或许是另一个适合向投资人及业界深度分享的「好故事」。
黄仁勋总结 GTC 2025 的发布重点
半小时内狂轰 Physical AI 新成果
在 2025 年 1 月初开幕的 CES 2025 上,英伟达发布世界基础模型 Cosmos,黄仁勋高喊「AI 的下一个前沿是物理」,一举将 Physical AI 推向 AI 主舞台。所谓的 Physical AI 是指让机器人、自动驾驶汽车和智能空间等自主系统感知、理解并执行真实世界中的复杂操作。
将时间拉回到 3 月 19 日凌晨,在主题演讲的尾声,小型机器人 Blue 的登台将现场氛围推向高潮,欢呼声不断。而双方的互动也为我们描绘出了 Physical AI 的轮廓。
Blue 与黄仁勋同台
在最后不足半小时的时间内,黄仁勋密集地抛出了一系列重磅消息。
首先是推出开源 Physical AI 数据集,为开发人员提供 15TB 的数据,包含数千小时的多摄像头视频,超过 32 万条用于机器人训练的轨迹,以及多达 1,000 个通用场景描述 (OpenUSD),在多样性、规模和地理位置覆盖上表现出色,因其可识别异常值、评估模型泛化性能,将特别有利于安全研究领域。值得一提的是,英伟达官方表示,该数据集将随时间推移不断扩增,或将成为全球最大的统一开源 Physical AI 数据集。
* 数据集下载地址:
https://go.hyper.ai/mkTKR
其次是全球首个开源、完全可定制的基础模型 NVIDIA Isaac GR00T N1,用于模仿人类推理及其他技能。GR00T N1 基础模型采用双系统架构,其灵感来自人类认知原理。「系统 1」是一个快速思考的行动模型,反映了人类的条件反射或直觉。「系统 2」是一个慢速思维模型,用于深思熟虑、有条不紊的决策。
第三是推出面向机器人仿真的开源物理引擎 Newton,将由 NVIDIA、谷歌 DeepMind 和迪士尼研究院共同开发,基于 NVIDIA CUDA-X 加速库 NVIDIA Warp,为开发人员提供了一种简单的方法来编写基于 GPU 加速的内核程序,用于模拟人工智能、机器人和机器学习 (ML)。
Newton 架构以 NVIDIA Warp 为基础
最后是更新了 Cosmos 世界基础模型,引入了一个开源且完全可定制的推理模型,专为 Physical AI 开发设计。其中,Cosmos Transfer 用于生成合成数据,其接收结构化视频输入,如分割图、深度图、激光雷达扫描、姿态估计图和轨迹图,以生成可控的逼真视频输出。Cosmos Predict 用于智能世界生成,将支持多帧生成,在给定起始和结束输入图像时预测中间动作或运动轨迹。Cosmos Reason 用于提升 Physical AI 数据标注与整理效率,优化现有世界基础模型或构建全新的视觉语言动作模型。
从 Accelerated Computing 到 Accelerated Science
除了 Physical AI 之外,英伟达在 AI for Science 领域的布局持续加深,未来或许也将成为其新的增长点。
英伟达与 AI for Science 的渊源或许可以追溯到 CUDA 的诞生,始于加速计算 (Accelerated Computing) 与高性能计算 (HPC) 的强强联合。黄仁勋曾表示,「自 CUDA 诞生以来,NVIDIA 将计算成本降低至之前的百万分之一。对一些人来说,NVIDIA 就像一台计算显微镜,让他们能够观察到极其微小的东西;对另一些人来说则像一台望远镜,让他们能够探索难以想象的遥远星系;对许多人来说,它是一台时间机器,让他们能够在有生之年从事毕生的事业」。
换言之,正是 CUDA 与英伟达 GPU 的生态组合,使得并行计算能力大幅提升,加速了科研领域的高性能计算应用。而如今,AI 更是为科研行业注入强劲动能,实现了从 Accelerated Computing 到 Accelerated Science 的跃迁。英伟达站在这场技术变革风暴的中心,理应具有前瞻性地把握住这一机遇。
而就在刚刚结束的 GTC 2025 主题演讲上,黄仁勋宣布,开发人员现在可以利用 CUDA-X 与最新的 superchip 架构实现 CPU 和 GPU 资源之间更紧密的自动集成与协调,与使用传统加速计算架构相比,其工程计算工具 (computational engineering tools) 的速度提高 11 倍,计算量提高 5 倍。
黄仁勋总结道,CUDA-X 目前已经为天文学、粒子物理学、量子物理学、汽车、航空航天和半导体设计等一系列新的工程学科带来了加速计算。
在 2018 年的 GTC 大会上,英伟达首次公布了用于医疗行业的 AI 平台 NVIDIA Clara,最初聚焦在医学影像领域,提供基于 GPU 的 AI 解决方案,加速医疗图像数据处理。2019 年,NVIDIA Clara 进一步扩展,新增基因组学计算平台 Clara Genomics,用于 DNA/RNA 序列分析,加速基因数据处理。
2019 年底,英伟达收购了基因测序软件开发公司 Parabricks,并将其 GPU 加速基因测序工具整合到 NVIDIA Clara 平台中,根据英伟达的官方文档,Parabricks 可以在 10 分钟内分析 30x 全人类基因组数据,而其他方法需要 30 个小时。
在 2021 年的 GTC 大会上,英伟达推出专用于医疗设备的实时 AI 计算平台 Clara Holoscan,目标是让医疗设备具备实时 AI 计算能力,进而提高医学影像分析、手术辅助、远程医疗的智能化水平。
而在 2022 年 9 月召开的 GTC 大会上,英伟达进一步扩充了 Clara,发布了 BioNeMo。彼时,英伟达 AI for Science 的蓝图也愈发清晰了,从 AI 加速计算到生成式 AI,从最初的医学影像 AI 平台,走向了更深刻的生命科学研究。具体而言,BioNeMo 是一个用于在超大计算规模下训练和部署大型生物分子语言模型的框架,包含了 4 种预训练语言模型:
* 蛋白质 LLM ESM-1:可处理氨基酸序列,生成可用于预测各种蛋白质特性和功能的表征,提高科学家理解蛋白质结构的能力。
* 蛋白质建模工具 OpenFold 的开源版本。
* 生成式化学模型 MegaMolBART:可用于反应预测、分子优化和全新分子生成。
* ProtT5:由慕尼黑工业大学 RostLab 与英伟达合作开发,将 Meta AI 的 ESM-1b 等蛋白质 LLM 的功能扩展到了序列生成。
除了医疗与生命科学研究外,英伟达还在 GTC 2024 上发布了气候数字孪生云平台 Earth-2,采用其新推出的生成式 AI 模型 CorrDiff,结合 NVIDIA FourCastNet,可实现 1 公里级别的全球气候模拟。
结语
每一届 GTC 大会早已从企业新产品、新技术「推介」,升级为行业风向标。而在今年的大会上,我们看到了黄仁勋对下一代芯片架构及产品的期许,也看到其在机器人、自动驾驶、科学计算领域的积极布局。寄希望于后者快速成长为英伟达的主供血库显然为时尚早,但如何快速扭转当下的市场情绪为前者肃清障碍也同样颇具挑战。不妨让我们共同期待老黄后续还有哪些「奇招」?


戳“阅读原文”,免费获取海量数据集资源!
(文:HyperAI超神经)