摩尔线程副总裁王华：基于FP8的国产万卡集群训练

6月26日，由智猩猩、智东西共同发起主办的2025中国AI算力大会将在北京中关村东升科技园万丽酒店正式举行！本次大会也是“智领未来”北京人工智能系列活动之一。

大会设有主会场、分会场和展览区。其中，主会场将进行高峰论坛、AI推理算力专题论坛和智算中心专题论坛，分会场全天将先后进行智算集群异构混训技术研讨会、超节点技术研讨会。

在大会上午主会场的高峰论坛上，摩尔线程副总裁王华将带来演讲，主题为《基于FP8的国产万卡集群训练》。

Part.1

嘉宾介绍

王华，摩尔线程副总裁，负责AI与云计算相关业务，工作内容涵盖智算集群的软硬件栈，包括计算、存储、网络、集群管理、AI软件等方面，孵化了基于MTT GPU的智算集群产品，支持大规模分布式模型训练和推理。

Part.2

演讲主题

《基于FP8的国产万卡集群训练》

Part.3

演讲概要

随着计算量的不断攀升，大模型训练需要一个“大且通用”的加速计算平台来缩短训练时间，实现模型能力的快速迭代。

当前，国际科技巨头都在积极部署万卡乃至超万卡规模的计算集群，以确保其大模型产品的竞争力。随着模型参数量从千亿迈向万亿，模型能力更加泛化，大模型对底层算力的需求也在不断升级，万卡甚至超万卡集群成为这一轮大模型竞赛的基本要求。

顺应趋势，摩尔线程宣布其AI旗舰产品夸娥（KUAE）智算集群解决方案实现了重大升级，从当前的千卡级别大幅扩展至万卡规模。作为国内首家支持全计算精度的全功能GPU企业，摩尔线程率先实现FP8精度计算，其全功能GPU可高效满足DeepSeek V3/R1等大模型的FP8原生预训练计算需求。

本次演讲将分享摩尔线程万卡集群实践经验，讲述国产GPU在实际部署中的挑战与难点，以及阐述摩尔线程软硬一体的集群解决方案的优势与关键特性。

大家可以扫描海报上的二维码添加小助手“雪梨”进行报名，也可以从文章底部【阅读原文】进入大会官网了解报名。已添加过“雪梨”的老朋友，可以给“雪梨”私信，发送“AI算力”即可报名。

（文：智东西）