忘了4090吧,5090来了!

在 2025 年 1 月 7 日的拉斯维加斯 CES 展会上,英伟达 CEO 黄仁勋发表了主题演讲,涵盖了 GPU、AI、游戏和机器人等多个领域。他的演讲从回顾英伟达 GPU 的发展历程开始,从最初的 2D 到 3D,再到 CUDA 的诞生和 RTX 技术的推出,展示了英伟达在图形处理领域的创新历程。黄仁勋指出,随着人工智能时代的到来,GPU 不仅推动了 AI 从感知进化到生成,还将进一步发展为智能体,未来甚至将进入物理世界的应用.

在演讲中,黄仁勋重点介绍了英伟达的 RTX 50 系列显卡。他手持 RTX 5090 显卡,展示了其强大的性能参数。RTX 5090 拥有 920 亿晶体管,AI 性能达到 3352 TOPS,RT 性能为 380 TFLOPS,着色单元性能为 125 TFLOPS。该显卡配备了 32 GB GDDR7 显存,显存位宽为 512 位,CUDA 核心数量为 21760,功耗为 575W。RTX 5090 是目前最快的 GeForce RTX GPU,其性能在 Blackwell 架构和 DLSS 4 技术的加持下,比 RTX 4090 提高了两倍.

新一代的 DLSS 4 技术将性能提升了 8 倍。英伟达首次推出了多帧生成功能,通过 AI 为每个渲染帧生成多达三帧,从而显著提高帧速率。DLSS 4 还引入了图形行业首个基于 Transformer 模型架构的实时应用,使用更多的参数和算力,以提供更高的稳定性、更好的重影效果、更高的细节和增强的抗锯齿效果。在发布当天,DLSS 4 已经在超过 75 款游戏和应用程序中支持 RTX 50 系列 GPU.


此外,NVIDIA Reflex 2 技术引入了 Frame Warp 创新,通过在将渲染帧发送到显示器之前根据最新的输入更新渲染帧来减少游戏延迟,最多可将延迟降低 75%,为玩家在多人游戏中提供竞争优势,并使单人游戏的响应速度更快.


Blackwell 架构还将 AI 引入了着色器。25 年前,NVIDIA 推出了 GeForce 3 和可编程着色器,奠定了长达 20 年的图形创新基础。此次,NVIDIA 推出了 RTX 神经着色器,将小规模 AI 网络引入可编程着色器,在实时游戏中解锁电影级材质和灯光等效果。RTX Neural Faces 技术则将简单的光栅化人脸和 3D 姿势数据作为输入,使用生成式 AI 实时渲染高质量的数字人脸,与用于光线追踪头发和皮肤的全新 RTX 技术相得益彰,并与 RTX Mega Geometry 一起,实现多达 100 倍的光线追踪三角形,为游戏角色和环境带来巨大的真实感飞跃.


在价格方面,黄仁勋以 RTX 4090 的价格为参考,推出了 RTX 5070,售价为 549 美元(国行售价 4599 元),提供与 RTX 4090 相当的性能。而 RTX 5090 的售价则为 1999 美元,国行的 RTX 5090D 价格为 16499 元起,RTX 5080 为 8299 元起.


在移动端,RTX 50 系列的性能提升也非常显著。黄仁勋展示了搭载 RTX 5070 的笔记本,并表示今年移动版显卡的上市速度会很快,预计最早在 3 月份就会有搭载 RTX 50 系列显卡的设备上市.


在演讲中,黄仁勋还展示了英伟达的 Grace Blackwell NVLink72,这是一款拥有 72 个 Blackwell GPU 的晶圆,AI 浮点性能达到 1.4 ExaFLOPS。与上一代产品相比,Blackwell 的每瓦性能提高了 4 倍.


英伟达还推出了基于 Llama 的一系列模型,包括 Llama Nemotron Nano、Super 和 Ultra,涵盖从 PC 和边缘设备到大型数据中心等所有领域。这些模型以 NIM 微服务的形式提供,基于 NIM 微服务构建的英伟达 AI Blueprints 可提供易于使用的预先配置好的参考工作流程.


在 AI 的下一个前沿——物理 AI 方面,英伟达发布了世界模型 Cosmos 平台,包含 SOTA 的生成式基础世界模型、高级的 tokenizer、护栏以及高速视频处理流程。Cosmos 的目标是推动自动驾驶汽车和机器人等物理 AI 系统的发展。Cosmos 世界基础模型(WFM)为开发者提供了一种生成大量照片级真实、基于物理的合成数据的简便方法,以训练和评估现有的模型。开发者还可以通过微调 Cosmos WFM 来构建定制模型.


黄仁勋表示,机器人技术的 ChatGPT 时刻即将到来,世界基础模型对于推动机器人和自动驾驶汽车的开发至关重要。Cosmos 的推出旨在让物理 AI 普及化,让每个开发者都能用上通用机器人技术.


为了帮助开发者节省数据整理、训练和模型定制方面的成本,Cosmos 提供了 NVIDIA AI 和 CUDA 加速数据处理 pipeline,由 NVIDIA NeMo Curator 提供支持,使开发人员能够在 14 天内处理、整理和标记 2000 万小时的视频,而使用 CPU-only 的 pipeline 则需要三年多的时间. NVIDIA Cosmos Tokenizer 是一种最先进的视觉 tokenizer,用于将图像和视频转换为 token,其总压缩率提高了 8 倍,处理速度提高了 12 倍.


英伟达还将之前的 AI 超级计算机 DGX-1 升级成了 Project DIGITS。Project DIGITS 采用全新的英伟达 GB10 Grace Blackwell 超级芯片,可提供 PFLOPS 级 AI 计算性能,适用于原型设计、微调和运行大型 AI 模型. GB10 超级芯片在 FP4 精度下可提供高达 1 PFLOPS 的 AI 性能,配备 Blackwell GPU 和高性能 Grace CPU,通过 NVLink-C2C 芯片间互连连接.


Project DIGITS 使用户能够在标准电源插座下获得强大的性能,每个系统具有 128GB 内存和高达 4TB 的 NVMe 存储。借助这款超级计算机,开发者可以运行多达 2000 亿参数的大型语言模型,从而加速 AI 创新. 此外,通过 NVIDIA ConnectX 网络,还可将两台 Project DIGITS AI 超级计算机连接起来,运行多达 4050 亿参数的模型.


借助 Grace Blackwell 架构,企业和研究人员可以在运行 Linux 版 NVIDIA DGX OS 的本地 Project DIGITS 系统上对模型进行原型设计、微调和测试,然后将其无缝部署到 NVIDIA DGX Cloud、加速云实例或数据中心基础架构上. Project DIGITS 用户还可以访问广泛的 NVIDIA AI 软件库进行实验和原型设计,包括 NVIDIA NGC 目录和 NVIDIA 开发者门户中提供的软件开发套件、编排工具、框架和模型.


英伟达表示,其以及顶级合作伙伴将在 5 月推出 Project DIGITS,起售价为 3000 美元。通过这些创新和产品,英伟达继续在 AI 和图形计算领域引领行业发展,为全球的开发者和研究人员提供强大的工具和平台.

(本文由Kimi协助)

(文:路过银河AI)

欢迎分享

发表评论