花几个亿建智算中心,八成的GPU租不出去 |智涌分析

智算中心机房的出租率普遍在20%-30%之间,有些企业级智算中心甚至只有10%。

邱晓芬

编辑苏建勋

在过去两年的中国AI行业,有一项奇观:

许多没有任何GPU背景、算力行业经验的上市公司,将智算中心当做他们发展第二曲线的抓手,筹谋向AI领域转型——比如,生产味精的公司(莲花控股)、造染料的公司(锦鸡股份)、甚至还有博彩行业的玩家(鸿博股份)等等。

但到2024年年底,情况出现了逆转。

11月29日,莲花控股公告称,他们近7个亿的GPU服务器采购合同,只交付了12台,剩余的318台因为“存在不确定性”,决定终止合同——按照一台英伟达H800服务器210万元的价格来算,布局智算中心转型近两年,这家公司只营收了2500万。

不仅仅是莲花控股,近期还有不少上市公司公告称,决定暂停、或者取消原定的智算中心建设项目,不惜顶着合同违约的风险。

图源IC Photo

在行业对AI预期高涨的两年来,国内的智算中心建设可谓疯狂——截至今年上半年,国内算力规模达到246 EFLOPS,智能算力同比增速超过65%,工业、教育、医疗、能源等多个领域算力应用项目超过1.3万个。

这些上市公司在一波智算中心建设热潮中,扮演的角色不尽相同,有的选择简单粗暴的出钱参与投建,有的选择出设备(比如GPU/软件解决方案/算法模型),也有的从更轻巧的方式介入,帮助算力中心提供运营服务。

从两年前的趋之若鹜,到如今由热转冷,国内的智算中心发生了什么?

一笔艰难的账

有多位智算中心人士近期走访国内各大智算中心时,惊叹于当前行业现状。他们不约而同向《智能涌现》表示,目前国内的算力中心市场陷入沉寂。

“目前看下来,机房的出租率普遍在20%-30%之间,有些企业级智算中心甚至只有10%左右”,一位行业人士表示。

从纯商业的角度,这并不是一个健康的状态。一位行业人士向《智能涌现》拆解了一个智算中心的成本构成——

以一个英伟达H100构成的千卡集群智算中心为例,前期投入成本为:

购买算力设备约3亿;

网络设备成本约2.5千万;

存储和安全设备成本约1千万;

平台软件和液冷改造成本约1千万;

共计约3.5亿元的总成本。

而智算中心不仅仅在前期需要投入重资产,后续运转过程中,还要投入日常的电力、维护、人员费用等等,经测算,每年的支出大概在五千万元左右。

也就是说,在国内搭一个千卡集群规模的小智算中心,前期要支付3.5亿硬成本,每年还要掏五千万元去支撑运转。

图源IC Photo

而这些智算中心建成之后,算力输送给谁?怎么赚钱?

目前,国内厂商解决AI算力的方式是:大互联网公司、弹药充足的AI公司、以及细分赛道的龙头企业,一般基于安全考虑,搭建自己的智算中心。而其他大部分需要AI算力的公司,基本选择向第三方智算中心租赁算力的模式。

另外,这些智算中心也会为在前三类玩家需要的情况下,为其补充部分算力,应对不时之需。

近两年来,智算中心建设热情,一部分源于,虽然成本高昂,但好在有政府补贴缓解。最近两年,各地出台了多种多样的政策支持智算中心的建设,资金补贴、税收优惠、土地供应等等。

比如,有地方政策提示,当项目总投入在1亿以上时,将以实际投资额5%-15%不等的比例进行补贴。在有些风/光资源丰富的省份,还会对于投建智算中心的企业,赠与多余的光伏指标。

一位行业人士概括,各地对于智算中心建设的支持政策,是需要“一地一议”的程度。

不过,补贴毕竟不在商业范畴,白花花的银子建起智算中心后,钱后续能不能回笼,主要与实际运作之后能租出去多少卡(也就是机房利用率)、以及租赁价格挂钩。

而在目前,这两项数据并不乐观。《智能涌现》在不久前的文章指出,一台英伟达H100服务器(8卡)的租赁价格,从年初的12-18万元/月,降到目前的7.5万元/月,降幅在50%左右。

如果以当前机房利用率20%来计算,一个英伟达H100千卡集群智算中心每年的营收仅有2300万元( 即7.5 万元/月✖️12 个月✖️128 台服务器✖️20%)——也就是说,一个算力中心就算勉强维持经营,结果基本只能覆盖正常运营成本的一半,更谈不上把前面的重资产收回本。

投建智算中心,当下是一笔艰难的账。

1.3万个算力中心,苦等回血

多位行业人士向《智能涌现》表示,智算中心当前出现严重闲置的情况,核心原因在于,算力中心投入应用之后,大家发现AI需求并未如预期般快速增长,算力难以消纳。

“此前大家预计,国内的算力租赁市场每年至少有10%增长,结果目前看来,只有5%左右”。

因此,目前各个智算中心的目标都是覆盖运营成本,“本甚至是最高标准、长远的理想”。一家智算中心产业链公司「智伯乐科技」CEO岳远航告诉《智能涌现》,经他们测算之后发现,一个智算中心纵使设备出租率涨到60%,至少还要花上7年以上才能回本。

图源IC Photo

除了AI需求没有如预期般出现之外,智算中心闲置,本质上与其存在一定滞后性有关。

比如,一些智算中心在设计研究的时候,一般是根据当下的市场需求、以及硬件情况去设计。而等到真正落地时,一般已经过去了几个月甚至数年——而此时,硬件产品可能已经迭代好几轮了,甚至市场需求也已经出现了剧变。

为了尽可能降低日常运营成本,目前一些智算中心各自采取了措施。

有的智算中心直接关停租不出去的设备,“走进去机房里,发现灯都关了,也没有了嗡嗡的风扇散热声音”,岳远航表示。另外,也有的智算中心选择直接变卖英特尔、英伟达的旧设备,尽量缓解资金压力。

对于一些还没建设完毕的智算中心,有的企业选择暂停了建设中的项目,或者直接取消了规划里的二期项目。一位行业人士甚至《智能涌现》表示,因为智算中心项目中途暂停,导致其此前斥资千万高价购买的英伟达卡“砸手里”了。

显然,算力市场正在悄然转变为买方市场。在过去两年,如果说行业里是“一芯难求”、“算力难求”的情况,到如今则完全反过来。

目前大部分AI公司更加倾向于节约算力,避免不必要的成本支出,一般都会根据需求和预算选择合适的算力资源,比如要求更低的优惠价格、以及更优质的服务。

一些智算中心为了维持算力销售,争取市场份额,也不惜采用降价、或者提高服务(比如提高运营能力,帮下游优化模型等等)等方式来吸引下游用户。

算力作为水电煤一般的存在,牢牢掌握住了AI行业的命脉,尤其是在国际形势并不明朗的当下。尽管算力中心在当前阶段是一笔艰难的帐,但我们也很难粗暴得出不应再建设的结论。

对于长远,有行业人士抛出了一个问题——

“AI算力消纳不了或许只是短期现象,你是现在暂时让算力中心闲置着好?还是等到未来AI应用爆发了,你再匆忙上马建设算力中心好?”

封面来源IC photo

👇🏻 AI👇🏻

36AI
👇🏻  👇🏻

(文:智能涌现)

欢迎分享

发表评论