刚刚,AMD、OpenAI联合发布超强AI芯片,推理提升35倍

专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注!

今天凌晨,AMD举办了2025全球AI发展大会,主要发布、介绍了最新AI芯片和云基础硬件设备。

OpenAI联合创始人兼首席执行官Sam Altman作为特邀嘉宾出席了本次大会,并与ADM联合发布了Instinct MI400Instinct MI350系列超强AI芯片。尤其是在研发的过程中,OpenAI一直为AMD提供技术反馈,帮助其优化GPU

在发布会现场,当Sam Altman听到单个MI400配备432GHBM4内存时也惊呆了,直呼不可能。

AMD本次发布的最新AI芯片主要与英伟达的Blackwell 芯片竞争,英伟达目前是 AMD AI数据中心GPU领域的唯一竞争对手。

AMD Instinct™ MI350系列GPU是基于AMD CDNA™ 4架构的最新产品,专为现代AI基础设施的需求而设计。该系列包括MI350XMI355X两款GPU

与上一代产品相比,MI350配备了288GBHBM3E内存和高达8TB/s的内存带宽,在AI计算能力上提升了4倍,推理性能提升了35倍。

AMD表示,由于芯片功耗低于竞争对手,MI355X每美元可提供比英伟达芯片多40%tokens

MI355X平台在FP4性能上达到了161 PFLOPS,而MI350X平台则在FP16性能上达到了36.8 PFLOPS。这些GPU不仅在性能上表现出色,还提供了灵活的冷却配置,包括风冷和直接液体冷却,能够支持大规模部署,例如在一个风冷机架中支持多达64GPU,或在直接液体冷却环境中支持多达128GPU

为了进一步提升GPU的性能,AMD还开源了一个AI加速平台ROCm7。在过去一年中,ROCm迅速成熟,提供了领先的推理性能,扩展了训练能力,并与开源社区深度整合。ROCm现在支持一些世界上最大的AI平台,例如LLaMADeepSeek,并在即将发布的ROCm 7版本中提供了超过3.5倍的推理性能提升。

ROCm Enterprise AIAI部署提供了完整的MLOps平台,支持安全、可扩展的AI开发,并提供了丰富的工具用于微调、合规性、部署和集成。

Instinct MI400则是AMD下一代旗舰AI芯片,也是AI一体机“Helios”的核心组件。在内存配置上,MI400 系列预计搭载最高 432GBHBM4 高速显存,较前代MI350系列的 36TB HBM3E内存大幅度提升,高带宽内存架构能为大型 AI 模型提供充足的数据吞吐量,满足模型参数加载与快速运算的需求。

计算性能方面,MI400 系列在 FP4 精度下可达40 petaflops 的算力,这一指标专为 AI 训练中的低精度计算优化,可有效加速 Transformer 等主流模型的训练效率。同时,其配备的 300GB/s  scale-out 带宽,通过 UALink 开放标准技术实现72GPU的无缝互联,使整个机架内的 GPU 能作为统一计算单元协同工作,突破传统架构的通信瓶颈。

MI400系列与6th Gen AMD EPYC “Venice” CPU  Pensando “Vulcano” AI NIC 形成技术协同。其中,基于 Zen 6 架构的 Venice CPU 提供高达 256 个核心和 1.6TB/s 的内存带宽,确保对 GPU 集群的高效任务调度与资源管理;

 Vulcano AI NIC 支持 800G 网络吞吐量,其 UALink  PCIe 双接口设计实现了 GPU  CPU 之间的低延迟数据传输,较前代产品提升 8 倍 scale-out 带宽,有效解决高密度集群中的通信拥塞问题。

在架构设计上,MI400 系列采用开放标准的 UALink 技术,区别于英伟达的专有互联方案,该技术通过以太网隧道实现 GPU 间的高速连接,支持机架级别的统一计算资源池化,配合 OCP  Ultra Ethernet Consortium 的开放架构,确保与现有数据中心基础设施的兼容性。预计MI400将在2026年上市。

除了OpenAI之外,微软、甲骨文(Oracle)、MetaxAI7AI开发平台正在与AMD合作使用其AI芯片。

Oracle将是首批采用Instinct MI355X驱动的机架级解决方案的行业领导者之一,突显了Oracle提供最广泛的AI基础设施的承诺。甲骨文云基础设施支持各种关键任务企业工作负载,对可扩展性、可靠性、安全性和性能有严格要求。

Oracle云基础设施执行副总裁Mahesh Thiagarajan表示,Oracle云基础设施继续从与AMD的战略合作中受益。我们将是首批提供使用EPYCInstinctPensando组合力量的MI355X机架级基础设施的公司之一。

我们看到客户对AMD驱动的裸金属实例的采用令人印象深刻,这突显了客户如何轻松地采用和扩展他们的AI工作负载。此外,Oracle在内部为其自身工作负载以及外部面向客户的应用程序中广泛依赖AMD技术。我们计划继续在多个AMD产品代中进行深度合作,并对AMD路线图及其持续满足预期的能力充满信心。

(文:AIGC开放社区)

发表评论

×

下载每时AI手机APP

 

和大家一起交流AI最新资讯!

立即前往