老黄最新演讲!新一代B300与“万卡互联”MVLink登场:驱动万亿参数模型与AI工厂



 

老黄最新演讲!

老黄在COMPUTEX 2025中国台北展前发表了主题演讲,讲了公司在“AI工厂”时代的最新进展和未来愿景


演讲核心信息围绕 “AI工厂” 展开。黄仁勋将当前的技术变革定义为“AI工厂”的崛起,这些工厂消耗能源以生产“智能”(代币/tokens)。NVIDIA已从芯片公司转型为AI基础设施公司,为这个价值数万亿美元的新时代提供基础技术,并以其长达五年的技术路线图来体现其基础设施角色

关键技术与平台

CUDA-X库被持续强调为NVIDIA成功的核心,赋能图形、5G/6G、基因组学、量子计算、深度学习和计算光刻(与台积电、ASML、Synopsys等合作)等多个领域。新款GeForce RTX 5060亮相,AI(DLSS技术)通过仅渲染十分之一像素、其余由AI预测的方式革新了图形处理,RTX 50系列也取得了史上最成功的发布。超越生成式AI的下一步是“智能体AI (Agentic AI)”和“物理AI (Physical AI)”,前者涉及推理、解决问题和工具使用,后者则理解物理世界属性,共同导向通用机器人技术

旗舰计算平台Grace Blackwell:“会思考的机器”和“一个巨型GPU”,已全面投产

升级版的Grace Blackwell GB300系统将于第三季度推出,推理性能提升1.5倍,HBM显存增加1.5倍,网络带宽提升2倍,同时保持相同架构和物理尺寸。其架构细节包括液冷计算节点、MVLink交换机以及重达70磅、拥有2英里/5000根线缆、带宽高达130TB/s(超过整个互联网峰值流量)的MVLink Spine,可将72个GPU连接成一个逻辑上的巨型GPU。XAI Colossus (1GW)等大规模AI工厂实体部署也得到展示

GB300

生态系统与定制化

NVIDIA推出了MVLink Fusion计划。该计划允许合作伙伴(如联发科、Astera Labs、Marvell)和客户(如超大规模数据中心、CPU供应商如富士通、高通)使用MVLink Chiplet将其自定义ASIC或CPU集成到NVIDIA的MVLink Fabric和GPU生态系统中,提供构建半定制AI基础设施的灵活性

针对不同规模需求,NVIDIA发布了新系统。DGX Spark是一款紧凑型AI原生开发者系统(1 Petaflop, 128GB HBM显存),现已全面投产,用于原型设计和早期开发。DGX Station则是一款功能更强大的个人/桌面级DGX超级计算机,能够运行万亿参数级别的AI模型,并设计为可使用标准墙壁插座供电

企业AI转型是另一大重点

NVIDIA企业AI平台旨在将AI(特别是“数字员工”形态的智能体AI)引入传统企业IT。RTX PRO企业与Omniverse服务器是一款基于x86的服务器,可运行传统虚拟化管理程序(如VMware、Red Hat)和Kubernetes,并支持NVIDIA AI智能体。该服务器配备了新的Blackwell RTX PRO 6000 GPU和全新的CX8芯片(交换优先、先进网络芯片),在DeepSeek R1等模型上展现出相较H100显著的性能提升。NVIDIA AI数据平台 (IQ)是一个新型GPU加速存储平台,用于非结构化数据的语义查询,合作伙伴包括Vast、戴尔、日立、IBM、NetApp,并利用了NVIDIA NeMoTron推理模型。AI Ops则是一个软件层和生态系统(合作伙伴包括CrowdStrike、Dataiku、DataRobot、New Relic、Red Hat、趋势科技),用于企业AI的数据管理、模型微调、安全防护和部署

机器人与数字孪生技术

Isaac GR00T平台专为通用人形机器人设计,包括全新的机器人处理器Jetson Thor、NVIDIA Isaac操作系统以及现已开源的Isaac GR00T N1.5预训练模型。GR00T-Dreams是基于Cosmos(NVIDIA与DeepMind及迪士尼研究院合作开发的物理AI世界基础模型,其Newton物理引擎将于7月开源)的蓝图,它利用AI放大人类远程操作数据,生成大规模合成轨迹数据以更有效地训练机器人。Omniverse被中国台湾制造业巨头(如台积电、富士康、纬创、和硕、台达、广达、技嘉)广泛用于设计、仿真、优化工厂和生产线,并训练机器人集群

参考:

https://www.youtube.com/watch?v=TLzna9__DnI&t=4s




(文:AI寒武纪)

发表评论

×

下载每时AI手机APP

 

和大家一起交流AI最新资讯!

立即前往