英伟达的「圣诞礼物」来了!
新一代GB300和B300 GPU将在明年3月GTC大会上正式发布。
这次升级可不是简单的迭代,而是一次真正的技术突破。
新GPU在性能上有了质的飞跃:与前代B200相比,浮点运算性能提升了50%,显存容量更是直接飙升至288GB!
性能大幅提升的秘密
新一代GPU采用了TSMC 4NP工艺制程,在架构上进行了全新设计。
最令人惊叹的是,它的TDP功耗达到了1.4KW,比前代产品增加了整整200W。
在内存方面,GB300采用了12-Hi HBM3E内存技术,将单卡显存容量提升到了288GB,同时保持了每GPU 8TB/s的带宽。
LLM推理性能大幅提升
GB300在大语言模型推理方面的表现令人印象深刻:
批处理大小的优化带来了显著提升:
-
内存带宽提升带来43%的交互性能提升
-
更大的内存容量实现了约3倍的成本降低
-
72GPU内存共享解决了KVCache限制,支持10万+token的推理长度
供应链重组
GB300的发布也带来了供应链的重大变革。英伟达采用了全新的「SXM Puck」模块设计,这意味着:
-
制造不再局限于纬创和FII
-
电压调节模块(VRM)采购直接面向超算用户
-
引入了美国初创公司Axiado的HMC替代Aspeed
-
第二级内存采用LPCAMM模块,主要由美光供应
这次升级还包含了全新的800G ConnectX-8网络接口卡,提供了双倍的带宽扩展能力。
对于亚马逊这样的超算用户来说,这次升级还意味着他们可以自定义主板、散热等关键部件,从而实现更优的总体拥有成本(TCO)。
GTC 2025将于明年3月17日至20日举行,拭目以待这款重量级产品的正式亮相!
(文:AGI Hunt)