“芯片女王”苏姿丰告诉员工:我们每天醒来就是要打造伟大的产品

作者 | Bob Swan、Lisa Su
译者 | 刘雅梦
策划 | 褚杏娟

根据最新财报数据显示,AMD 在数据中心领域成功超越英特尔:AMD 在 2024 年第三季度的数据中心收入达到 35.49 亿美元,略高于英特尔的 33 亿美元。根据 SemiAnalysis 的数据,AMD 的 EPYC CPU 在市场上的采用率高于英特尔的 Xeon,这表明行业对 AMD 产品的偏好正在增加。

高性能计算是生成式 AI 的基石,如果说有人了解高性能芯片,那非 AMD 的首席执行官 Lisa Su 莫属了。在与 a16z 运营合作伙伴 Bob Swan(他本人曾担任英特尔的首席执行官)的对话中,Lisa 阐述了她对 AI 生态系统中计算发展的愿景,其中不仅涉及原始功率和摩尔定律的延续,还涉及 AMD 将如何支持“适合每种外形尺寸的正确计算”,以适应更广泛的现实世界中的生成式 AI 用例。Lisa 还分享了她对芯片制造现状的看法,AMD 如何将其研发周期与快速发展的行业相匹配,以及合作伙伴关系是如何构建强大的生态系统的。

Lisa 在计算领域的职业生涯

Bob:你在 AMD 工作了 12 年,其中担任首席执行(CEO)10 年。如果你愿意的话,请介绍下你的职业生涯以及你是如何加入 AMD 的。

Lisa: 我是做为一名工程师成长起来,我内心深处就是一名工程师。我上学时学的是半导体设备,我早期职业生涯的大部分时间都在 IBM 从事设备研发工作。每当想到世界上最有趣的事情时,我总是着迷于这样一个想法,即在芯片上所做的工作可以影响很多事情。技术是如此重要。所以这些年来,我一直站在高性能计算和计算领域的最前沿。

这让我在飞思卡尔半导体公司(Freescale Semiconductor)工作了 5 年,在那里我担任了一段时间的首席技术官(CTO),然后在 12 年前加入了 AMD。当我回答别人“你是做什么的?”时,我过去常说,“我是制造半导体芯片的。”人们会说,“那是什么?我们为什么要关心这个?它很重要吗”现在,每个人都知道半导体是什么,为什么它们如此重要,以及为什么它们能为我们生活中的一切提供动力。这就是我们所在行业的乐趣所在:你能够做对世界真正重要的事情。

Bob:如果你想想你刚开始工作的时候,与今天相比,计算在宏观层面上的作用是相对较小的。

Lisa:没错,Bob。想想 PC 和个人电脑,每个人都需要一台电脑,然后每个人都需要一部智能手机,再然后每个人都需要大型云数据中心,现在每个人都需要 AI 了,我确实认为这是一种半导体和芯片的力量如何真正渗透到商业世界和我们个人生活各个方面的演变。而且是好的,因为有了这些科技,我们的生活变得更好了。

生成式 AI 时代的计算

Bob:你如何看待 AI,它的相对重要性,然后从长远来看,它会把我们带到哪里去?以及你和 AMD 要带我们去哪里?

Lisa: 我认为,当我们思考在过去 30 年中我们看到的各种重大技术的断层时,我们会发现它们都非常重要。它们从小处着手,并真正影响着我们体验科技的方方面面。我认为 AI 可能是最重要的一个。我想说的是在过去的 30 年、40 年、50 年中,这不仅仅是技术。我的意思是,它确实是技术。但 AI 使我们所有人都能变得更聪明、更有效率,并真正利用现有的巨量数据来帮助我们前进。

我们还处在 AI 发展的早期阶段。对我们来说,这是一个将技术提升到一个不同水平的机会。对我们 AMD 来说,我相信 AI 将无处不在,存在于我们制造的每一款产品中,但重要的是,它是实现所有这些伟大应用的基础。所以,我们现在都在构建 AI 计算,我们正在尽可能快地构建它,这样就可以让所有聪明的开发人员真正利用这项技术。

Bob:正如你所说,这很吸引人,因为在某些方面,AI 已经存在了很长一段时间了。虽然新技术、创新往往起步缓慢,但这项技术发展得相当快。

Lisa:你说得对。它一直存在,我们一直认为它有很大的潜力。但是坦率地说,生成式 AI 之前的人工智能有点难以使用,因此需要专家才能真正解锁这项技术。我认为,正如我们都记得的那样,ChatGPT 时刻是人工智能变得简单的时刻。我们都可以与计算机聊天,并提出好问题。然而,它并非完美。我是说,我们还有很多工作要做。我们还处于早期阶段。但事实上,我们现在可以让这项技术如此普及,这使得生成式 AI 的弧线变得如此有趣,这也是加速其采用的原因。

Bob:但是对于 AMD 来说,你们一直是一家高性能的计算公司。当你考虑到它与你公司的交集、对行业的意义以及 AI 的覆盖时,你是否认为它与移动互联网有一些共同之处,正是这些共同之处让你能够很好地抓住这个机会?

Lisa:是的。我刚接任 AMD 首席执行官时,大约是 10 年前,我们当时真的在想,“我们应该做什么?”如果你还记得当时的情况,大概是在 2014 年手机或是平板电脑风靡一时,每个人都对这种东西感兴趣。我的董事会甚至问我,“Lisa,你应该知道,AMD 不能不涉足平板电脑,对吧?”我说,“嗯,我其实并不确定那是不是我们的专长。你知道,我们的专长是高性能计算。比如,我们建造大的东西。”

每个人都必须知道自己最擅长什么。而这正是我们最擅长的。我们最擅长的是构建大型复杂的微处理器或 GPU,或者通过收购 Xilinx,研发自适应和嵌入式计算。

当你展望未来时,你会发现高性能计算在行业的许多领域都非常重要,它是使 AI 成为可能的核心。因为如果你思考是什么使 AI 成为可能,那就是能够用数千亿个参数训练模型的能力,数万亿个参数,让它们变得超级智能。然后我们可以问它所有这些问题,而且大多数问题它都能回答正确。我们需要高性能的计算作为核心。

高性能还是多模态?

Bob:随着时间的推移,性能最高的芯片会成为差异化的因素吗?或者,它会随着 AI 世界中不同的工作负载和不同的多模态而发展?

Lisa:这是一个很好的观点,也是一个很好的问题。实际上,我相信我们需要为每种外形尺寸、每种应用提供合适的计算。目前,人们投入了大量精力来构建最大的语言模型,以及用于训练和推理的大型 GPU。但我确实看到,无论是在嵌入式应用程序、工业应用程序、汽车应用程序、医疗应用程序的边缘,还是在 PC 或手机的客户端层面,我们需要不同类型的 AI。因此,我们会有不同的引擎。 我的意思是,这就是激发整个行业创新的动力。

打造开放的生成式 AI 生态系统

Bob:我发现半导体行业最吸引人的另一件事可能是生态系统和不同参与者的重要性。当我们考虑产品开发时,我们如何处理我们需要做的事情,以及在交付需要大量不同参与者的产品时与生态系统之间的相互依赖关系?在产品研发的背景下,你如何看待这个问题,以及如何将产品推向市场?

Lisa:我认为没有哪家公司可以做所有这些事情。归根结底,我们都有自己的专长和擅长的事情,但密切合作、成为伙伴的机会非常重要。 我们非常相信开放的生态系统和行业标准,以及“嘿,我正在构建这些伟大的处理器。它们应该连接到其他人的网络,我们应该能够相互操作。”

软件生态系统也非常重要。你知道,开发人员不应该只为一家公司的硬件开发。开发人员应该能够开发他们需要的东西,并能够在底层使用最好的硬件。我认为这是开放生态系统演进的一部分,这样我们才能获得最好的创新。


Bob:在这个不断演进的过程中,我们已经看到了关于封闭式和可互操作性的争论,如果在 AI 世界中有这样一个开放的、可互操作的技术和接口,那么谁将是最大的赢家?

Lisa:我非常相信开放的生态系统。互操作性非常重要。 我们知道,如果我们看看技术的发展曲线,封闭的壁垒通常最终都会成为一个问题。在这个技术发展如此迅速的世界里,无论是新模型、新硬件技术还是新功能,我们都希望能确保它是可互操作的。


Bob:与此同时,你和业界的其他参与者最近宣布了新的超级加速链(Ultra Accelerator Link)和以太网链(Ethernet link)标准。这是你如何看待开放以及如何与生态系统互动的一个例子吗?

Lisa:是的,我认为这是一个很好的例子。当我们考虑未来需要的这些大型 AI 集群时,网络是其中非常重要的一部分。但是我们确实想选择要连接到的硬件是什么?处理器是什么?网络结构是什么?整体系统架构是什么吗?

因此,超级加速链(Ultra Accelerator Link)和超级以太网联盟(Ultra Ethernet Consortium)就是很好的例子,竞争对手和同行可以联合起来,说,“你知道吗,我们将采用开放标准,我们每个人都将在此基础上进行创新。”这是两个很好的例子,它包括许多竞争但也可以合作的公司,这正是开放生态系统应有的样子。

芯片供应链

Bob:你刚谈到了竞争对手和行业参与者的联合。过去几年对计算的需求,就其速度和分布而言,可能是前所未有的。有能力增加供应以满足这些令人难以置信的需求是非常重要的,尤其是在你投入更多产能和因为新冠疫情供应链中断的情况下。这些中断或挑战对你们的供应是否有影响?它们是否阻碍了你在某些领域快速行动的能力?你从中学到了什么可以让下一次行业供应限制变得更加平稳些的经验教训?

Lisa:回顾过去四五年,半导体供应链受到的最大干扰可能就是新冠疫情了。当时每个人都需要更多的半导体,这有点出乎意料。 半导体市场通常会出现一个市场上涨,另一个市场下跌的情况。我们知道,移动设备可能非常火爆,但基础设施将会下降,反之亦然。但我们在新冠疫情中看到的是,基本上每个市场都同时出现这种集中效应。

而且,半导体供应链实际上是非常擅长满足需求的。实际上,我们通常会超调。正如你所知道的,这种情况时有发生。但这需要时间,真正把这一切都做好需要 18 个月、24 个月的时间。所以我认为整个行业在增加供应方面做得很好。

最近与 AI 相关的事情是,很难获得 GPU。没有人预测生成式 AI 需要什么。因此,真正构建所有这些先进的封装能力和高带宽的内存能力需要一些时间。但是,半导体供应链在这方面做得很好。我们只需要在预测长期需求方面做得更好一些即可。


Bob:是的,我确实记得在 2019 年即将结束、2020 年即将到来之际,行业出现了正常的周期性。我想我们都在期待 2020 年……

Lisa:随着时间推移,它会逐渐下降。


Bob:……下降。然而新冠疫情在短时间内爆发,看起来情况进一步恶化。突然之间,正如你所说,每个人都需要供给。在很多方面,虽然存在一些问题,但半导体行业生态系统的整合方式和供应链的复杂性,尽管面临着挑战,但令人印象深刻。

Lisa:完全正确。我认为我们都因此变得更聪明、更优秀了。我认为,“让我们努力节省供应链中的每一分钱”的想法已经有点过时了,变成了“让我们在供应链中建立弹性”。 当政府问“你有足够的半导体吗?”时,我认为这让我们可以更广泛地思考弹性问题。

弹性和芯片法案

Bob:大约两年前有一部名为《芯片法案》(CHIPS Act)的法案。政府签署了一项法案,授权拨款 2800 亿美元帮助美国设计和制造半导体,其中 530 亿美元已被授权使用。我知道这项工作仍在进行中。但是,当你考虑《芯片法案》和过去几年的一些挑战时,你认为这对未来供应链的弹性有什么帮助吗?

Lisa:我不得不说,我是《芯片法案》的坚定支持者。 你知道,我从来没有想过,五年前半导体会成为美国政府认为需要明确产业政策的高优先事项。有些人说“这还不够”或者“这有什么不同吗?”我认为这带来了巨大的影响,因为它真正做到了将弹性和半导体的制造以及美国的研发放在了优先事项的首位。当然还有很多工作要做,正如你所说,这是一项正在进行的工作。

但这是一件好事,有一个焦点对行业来说是件好事。

事实上,我对研发方面正在进行的一些工作感到特别兴奋,因为我认为 这是一个真正培养下一代领导者的机会,他们将领导半导体研发以及未来的能力。 所以,我认为这是一件好事,但现在还为时过早。我们需要确保每一美元的支出都有充分的理由,并且我们能得到其他方面的投资回报。这清楚地表明了半导体对美国乃至全球经济的重要性。

AMD 如何平衡
长开发周期与短期创新

Bob:你们如何处理长周期研发和短周期创新的,以及这为你们在行业中带来了哪些固有的挑战或机遇?

Lisa:是的,我认为在我们的世界里,尤其是在硬件领域,最重要的是要有一颗“水晶球”。你永远不可能完全预测未来,但你确实需要能够说,“这些是即将到来的颠覆,这些是我们需要关注的事情。”我能想到的最好的例子可能是,这也是我们内部进行过大量辩论的一个例子,那就是摩尔定律的未来是什么?这一点还存在争议。


Bob:我还记得那些争论。

Lisa:顺便说一句,我相信摩尔定律已经被扩展了很多次了,因为人们非常聪明,每隔几年就能想出不同的方法来扩展同样的原理,比如更多的晶体管、更多的功能。但是举个例子,像先进的封装,什么时候会转向 2.5D 和 3D 封装这样的赌注,我们使用了这种称为小芯片的技术。我们当时做这个决定时并不知道这是否正确,但我们知道我们必须下这个赌注,而我们真的要等三到五年后才能弄清楚。所以你的问题是,我们怎么知道:在我们不知道的情况下,但要确保我们押注的方向是正确的然后我们必须足够敏捷,做出相应的调整。 这就是整个高性能计算世界的意义所在。


Bob:所以你们谈到了正确的赌注,你们在做出正确的赌注方面取得了令人难以置信的成功。你如何从客户那里了解正确的赌注,以及如何在给定的研发周期内引导客户,两者之间的平衡是什么?在 AMD,你是如何实现这种平衡的?

Lisa:我告诉你,我们公司最重要的两件事,这也是我一直告诉公司员工说的。第一个是,“我们是一家科技公司。我们的工作就是每天醒来,打造伟大的产品。”

但我们通过建立非常深厚的客户关系实现了这一点,因为我确实相信它们是相辅相成的。我们的客户是世界上最大的客户之一,无论是云制造商、原始设备制造商(OEM)还是企业,他们都看到了他们正在努力解决的问题。

最有益的是与我们的客户交谈,“你遇到了什么问题了?两年、三年、四年后你想解决什么问题?”然后我们的技术人员才能真正想出解决这些问题的办法。

因此,我们并不是一对一地听别人说的每一句话,但我们确实听了很多,因为这告诉我们,我们在做正确的事情。因为无论我们做什么,我们都要确保我们正在构建的技术能够解决别人的问题。

从超大规模市场中学到的经验教训

Bob:从超大规模的胜利中吸取的教训与 AI 的快速增长有何关联?你是否能够从赢得超大规模市场所需的条件中汲取经验教训?那么你如何将其转化为在 AI 中获胜筹码呢?

Lisa:当我们开始在超大规模市场中推出第一代产品 Zen 组合时,我认为我们大约只占服务器市场的 1%。事实上,与客户建立深度合作伙伴关系的整个想法是因为我们需要能够说,“这一切都与路线图有关”。是的,我们今天的产品很棒,但 关键在于我们是否能够在未来几代产品中保持持续的创新水平。 我认为我们在超大规模市场中取得了很大的进展。我喜欢我们与顶级品牌之间建立的关系,无论是与微软、亚马逊、谷歌、甲骨文还是 Meta,我们始终在思考如何共同创新的?

我认为 AI 的发展轨迹与此非常相似,因为这些超大规模企业都在押注他们的技术合作伙伴将是谁。我们希望能帮助他们实现这一目标。所以这是关于推出伟大的技术,但也要在执行上保持一致,并提供一个长期的路线图。


Bob:在 Zen 之前,你们在不到 1% 的市场份额上取得的进展令人难以置信。我记得那些不到 1% 的日子,但也不是很怀念,只是想让你记起。

Lisa:Bob,市场很不景气。正如我们所知道的那样,这是一个艰难的市场,但我们必须每天努力争取。

无晶圆厂对 AMD 意味着什么

Bob:所以,这就是你们保持领先地位并不断前进的原因。很多年前,在你们到来之前,你们并不是一家无晶圆厂(Fabless)公司,但现在随着 GlobalFoundries 的分拆……

Lisa:是的,是 GlobalFoundries 公司。


Bob:你们依赖于这个生态系统,制造业的生态系统。你能谈谈与客户和超大规模企业紧密整合的挑战,以及与晶圆厂紧密整合的需求吗?

Lisa:没错。所以这在当时对 AMD 来说是一个正确答案 那是在我上任之前,但要把制造业务和设计业务分开,我们没有足够的规模、资本支出和商业模式来实现这一点。现在,我们可以专注于我们擅长的领域,也就是设计。然而,我们必须与我们的制造伙伴紧密合作。

台积电(TSMC)是我们先进节点技术的主要制造合作伙伴。我们正在规划未来几年之后的发展。我们真的在研究我们的五年规划。我们需要学习如何与他人很好地合作,学习如何真正在其他领域获得建议,比如技术的发展方向以及我们如何优化我们的设计。我认为这是现在生态系统的一部分,而且它甚至更复杂,因为它不仅仅与硅有关,它还是关于封装,以及我们如何将这些芯片组合在一起,来处理非常复杂的多节点、多芯片类型的东西。


Bob:你谈到了整合,以及它不再仅仅是芯片的问题,但并购在很多方面都是你战略议程中非常重要的一部分,而且你在令人难以置信的时期进行了一些令人难以置信的收购,如 ZT Systems,也许你可以谈谈并购对你们的重要性,然后稍微阐明一下你是如何看待 ZT Systems 在解决客户问题的过程中所扮演的角色。

Lisa:没错。我们利用并购来完善我们的投资组合。所以,如果你回顾过去的五六年,我们可能已经收购了大约六家公司,有些规模较小,有些规模较大。Xilinx 是最大的半导体收购案。我认为它至今仍然是最大的半导体收购案,它将 FPGA 和自适应计算产品组合引入到了 AMD,这确实拓宽了我们的产品组合。我们宣布收购 ZT Systems,我们正在谈论 AI 以及 AI 的发展速度。我们看到,未来它不仅仅是硅片。硅片很重要,我们正在尽一切努力在封装的硅片上实现更多的计算技术。

软件非常重要,因此,我们需要有足够的 AI 软件人员,这样我们才能帮助我们的客户和合作伙伴利用我们的技术。但我们也发现,硬件、软件与实际系统的集成至关重要,因为现在我们正在构建这些非常大的高性能计算、CPU 和 GPU 集群。从网络角度、热的角度、可靠性的角度来看如何连接它们,这些对于真正提高生产效率都非常重要。这就是 ZT Systems,所以如果你考虑硬件、软件和现在的解决方案,它有点像我们凳子的第三条腿。

所以,我对此感到非常兴奋。这实际上是我们一直在解决的问题的扩展,即如何让我们的客户获得最佳的高性能计算,现在这个问题已经扩展到系统中了。

Lisa 对创始人的建议

Bob:你能谈谈你是如何看待初创公司在半导体领域的作用的吗?更具体地说,作为一家大公司的首席执行官,你如何看待初创公司在这个行业中的作用?

Lisa:现在有很多好主意,初创公司的美妙之处在于你有一个好主意,然后就可以得到像你这样伟大风险投资家的支持,你可以真正快速地创新、试验并学习这些想法。这真的非常有价值。我真的很享受我们与初创公司的合作。我们决定更加积极地开展这方面的工作。一是我们希望帮助很多这样的公司。顺便说一句,如果有人需要 GPU,我们很乐意与你合作。


Bob:大家都听懂了吗?有人需要 GPU 吗?

Lisa:小广告,小广告。

鲍勃:是的,没关系。

Lisa:我认为,尤其是现在,初创公司在前沿创新和实验方面发挥的作用从未如此强大。我看到的,也许你也看到了,即使是那些通常在与初创公司合作时更加保守的大企业,也变得更加开放了,因为这又回到了我所说的颠覆。没有人想在 AI 领域落后,所以他们想要有好主意的人来帮助他们在这个复杂的世界中实现目标,如果是一家初创公司,那就太好了。实际上,我们从初创公司那里学到了很多东西,他们行动的速度和节奏都非常惊人。

Bob:是的,在某种程度上,考虑到生态系统的发展演变进,随着时间的推移,进入半导体行业的门槛相对较高,因为你必须找人来为我们制造产品,以及你要筹集资金,如果这些资金必须用于建立自己的服务器群或自己的晶圆厂,那么初创公司生态系统就会缺乏创新。但是,超大规模企业及其所发挥的作用,使入门变得更加简单,而且利用现有的世界级代工能力,我们很高兴成为其中的一部分。

原文链接:

https://a16z.com/how-to-build-ai-ecosystem-lisa-su-ceo-of-amd/

(文:AI前线)

欢迎分享

发表评论