当AI成为“耗能巨兽”,算电协同将是下一个新风口?

文丨都保杰
近些年,“AI的尽头是电力”这句话成为了行业共识。
原因在于,以LLM、AIGC、AI Agent等为代表的AI技术应用大爆发,使得背后的大型数据中心成为耗电猛兽。相关预测显示,到2026年,全球数据中心的电力需求总和将超过1000TWh,相当于日本这个国家全年用电规模,到2030年,我国数据中心总用电量会占到全社会总用电量的4.8%,年均增速达20%。
在此背景下,推动算力与电力协同发展成为一个紧迫又长期的行业议题,从能源系统、AI公司、算力企业到国家产业政策等都在探寻一条匹配AI时代的破局之路。
行业试图用AI的方法破解AI造成的难题,这促使针对能源行业的各类大模型建设与应用步伐加速,以期优化能源系统生产供应,提升运营管理水平,据不完全统计,2024年前三季度,国内能源行业大模型公开招标项目就超过80个,上演了另一番“百模大战”。
算力与电力协同是个宏大时代议题,牵扯的产业链条十分宽泛,加之国家对于未来“绿色算力”的期待越来越大,新一轮算力、电力产业重构能否造就AI时代风口中的风口??会有哪些创新的思路和机会?
作为推动能源领域变革的AI创新企业,清鹏智能依托清华大学的核心技术与人才优势,利用时序、时空等海量大数据训练出了业内领先的能源大模型,并开发出了“电力量化交易”和“多能运行控制”两项AI智能体产品,致力于让电力交易更简单,让能源运行更经济,给能源产业提供了清鹏答案。
为此,头部科技专访了清鹏智能CEO兼清华电子院能源电子中心主任李中阳,收获了来自行业一线的最新洞见。
一个宏大又细微的时代课题
人工智能不断增加的能源消耗问题,或许可以从计算或电力的角度来解决。从计算角度看,整个AI行业可以探索降低AI大模型复杂性的方法,这样在模型性能没有显著下降的情况下可以减少能源需求,最典型的例子就是deepseek;从电力角度看,也可以努力增加能源供应,比如增加使用绿色能源。
但目前卡在中间的一大问题是,AI模型的规模和复杂性被广泛认为是现代人工智能成功的关键因素,而能源资源对于每个国家而言也是有限的,很难实现大幅增长。
清鹏智能团队的观点认为,如果AI模型的高密度计算、大规模能源需求与绿色能源供应等三方因素能在时间和空间上更好地协同,或将能产生巨大成本效益和能源利用效率,从而让“AI耗能巨兽”变得可持续供养。
关于这个新课题的提出,李中阳进行了多层面剖析。在过去,传统的通用算力中心,从用电角度来讲它的曲线是比较“平”的,对于电网而言基本可预期,行业一直把节能措施,降低PUE值等方面作为主要发力点,PUE值越低说明数据中心的能源利用效率越高,基础设施所消耗的能源占比越低,一些先进的数据中心已经能够将PUE控制在1.2以下。
随着AI产业的高速发展,智算已成为数据中心当下的主要发展方向。因为涉及到训练和推理,这些任务的计算量和数据量通常非常大,且具有高度的复杂性和不确定性,因此它的波动性很强,也会带动算力中心能耗负荷出现高波动性特点,对电网的稳定性提出挑战,已成为真实的行业痛点。
一方面是巨大的能耗和波动,但另一方面还存在资源的浪费。例如在很多大型万卡集群的AI训练中,出现负载率未满载的情况较为常见,这又涉及到很多其他环节问题,比如在建设规划环节就造成了资源的铺张浪费,怎么是一个比较科学的运营方案需要更多精细化分析,对于AI计算而言,还需要设置冗余,冗余度设置成多少、电网怎么去配电支持等行业现实问题都激发了很多可探讨的科研空间。
宏观层面,算力中心已然成为推动经济社会发展的核心引擎,其迅猛增长的能耗引发了各国关注,在此背景下,提升绿电比例正在成为实现算力中心可持续发展的关键路径。
2024年7月,中国国家发展改革委、工业和信息化部、国家能源局、国家数据局联合印发的《数据中心绿色低碳发展专项行动计划》明确提出,到2025年底,国家枢纽节点新建数据中心绿电占比需超80%,这对算力、电力双向协同机制提出了新的要求。
在这样的背景之下,一系列新的行业命题正在涌现:在规划层面,中国的新能源分布和未来算力中心、算力需求如何均衡部署,有没有充足的绿电供应,怎么去使用绿电,如何把控绿电和智算本身的波动性,深入到智算领域,训练和推理的特性也不一样,如何做好算力分配调度,涉及到智算中心经济模式的深层优化。
2025年,Deep Seek的火爆降低了AI应用的门槛,推动AI训练和推理的计算比例发生重大变化。IDC此前预测,云端推理占算力的比重正在逐步提升,预计到2026年推理占62.2%,训练占37.8%,有相关专家表示未来训练与推理的比例可能是1:20甚至更高,大规模推理的崛起会进一步改变现有AI计算格局。
李中阳表示:“整体来看,如果我们能够很深入地研究计算任务到能耗特性的关系,对算力中心节能加上算力任务的精细化掌控,其实就能让未来的算力中心变得更友好,对于电网负担来说更可控,对于业主方来说成本更低以及如何使用更多绿电。我们认为这是一个很有时代意义的研究方向,这个课题既需要对计算机体系架构的理解和创新,更需要协同优化技术的突破,以及电网架构的升级,期待学界和产业界共同推动发展。”
从技术到市场机制的协同探索
降低人工智能能耗这件事可以容纳很多学科。李中阳表示,首先可能还是计算机体系结构的持续创新,例如英伟达为代表的AI算力硬件厂商一直在不断优化算力与功率的比例,让算力的增长幅度高于功率。
另外一点就是大模型的优化, 如DeepSeek用670亿参数的模型超越Meta旗下4000亿参数Llama模型的性能效果,业内还有一些团队是在持续探索数据中心节能方向,比如液冷技术,以及数据中心热回收和利用技术等等。
清鹏智能在行业中探索着一条新的路径,将目标放在电力交易、电力的资产布局和电力应用市场之间的协同优化,通过多个不同的能源主体和算力中心协同优化为行业带来额外的能效提升。

我们希望这是一个商业化可持续的优化过程,在任何的计算中心应该都可以进行复制推广,而不是研究出一两项示范性技术就结束了。”李中阳说道。
因为AI行业迭代速率很快,也许过两年英伟达等硬件厂商又出了新的计算卡,也许还会混合多种国产计算卡集成在一起使用,大模型也在持续改进,在算力硬件和模型性能优化达到极限的情况下,如何让整个AI算力系统的功耗再进一步降低,这成为清鹏智能团队努力的目标方向之一。
清鹏智能团队在论文里提到,识别电力供应和人工智能计算能力消耗的模式,是实现计算-电力协同的基础。
如果未来的数据中心绿电占比要超过80%,第一关就是精准预测绿色能源,清鹏智能正在推动攻克这个问题。
从电力供应的角度来看,绿色能源的产生存在很大不确定性,他们建议利用时空模型,将气象预报和可再生能源发电量预测结合起来,开发用于电力预测的端到端大模型,此外,从电力消耗的角度来看,推动行业合作来建立定义硬件、人工智能模型和请求任务之间关系的人工智能能耗模型也非常关键。
在此基础之上,就可以从规划、调度和市场层面实施更深层次的优化。

例如,在规划层面,通过对计算能力网络和电网基础设施进行前瞻性的协同规划,解决计算能力需求和电力供应之间的长期不平衡问题;在调度层面,可以利用工作负载的灵活性,在时间和空间上进行转移,从而使计算能力需求与电力供应相匹配;在市场层面,构建新的市场机制和商业模式促进电力市场和计算能力市场之间的价格协调,从而引导计算能力和电力的匹配。
这是个需要一步步来推动的宏伟工程,李中阳表示:“形成一个全新的市场机制协同产业链上的各方利益是个关键,重要的环节例如调整算力的调度,通过算力调度节约的成本,合理进行利益分配,这样整个产业可能就打通了。”
目前,由于涉及不同的市场参与者,从电网到数据中心的价格机制和响应政策是分开设计的,如何从更高的站位实现整体优化,价格机制和响应策略之间的双向互动,仍是一个悬而未决的问题,此外,数据的开放性和质量、跨学科人才方面仍存在很多隔阂。
能源大模型商业化更快一步
近年来,在大语言模型兴起的同时,国内能源大模型领域也迎来了遍地开花的局面。
如国家电网的光明电力大模型、南方电网的大瓦特大模型、中国海油的海能人工智能模型、中国石油的昆仑大模型、国家能源集团的能源通道大模型等等。
与大语言模型属性不同的是,能源大模型或行业大模型更聚焦去解决一些行业内特定环节的问题,商业模式可能要比大语言模型更容易快速成熟。两者类似的是,底座模型只是个基础,就像OpenAI基于大模型包装出ChatGPT一样,基于能源大模型的各种AI Agent应用正在为产业带来切实的效率提升。

中国未来最大的增长可能是新能源领域,可能会有很多新能源场站,每个场站所处的地形、地貌、气象环境都不一样,人是很难处理这种大批量个性化的,但是对于AI而言却很容易,基于时空数据,就像互联网做用户画像一样,可以做到一站一策我觉得这是十分有想象空间的点。”李中阳表示。
目前,清鹏智能基于自身能源大模型训练出来的电力量化交易AI Agent,可以直接为电力交易需求提供端到端服务,在2024年的一场AI电力交易大赛PK中,其表现超越了90%的人类选手,与人类专家不相上下。
人类电力交易员的职责通常要包括市场分析、交易执行、风险管理、合同管理以及沟通协调等一系列环节,AI Agent的出现正在让一切变得更加智能化自动化,并在一定程度上实现人工替代。
能源是国之命脉,展望未来,李中阳认为,中国如何利用绿色能源和新能源产业优势去匹配更好的AI时代是个超级课题,整个行业都值得再重新做一遍。

(文:头部科技)

欢迎分享

发表评论