成立 5 年最高估值超百亿,摩尔线程之后,又一家AI芯片独角兽争当“国产 GPU 第一股”

整理|冬梅

6 月 23 日,中国证监会网站显示,国产 GPU 龙头之一的沐曦集成电路(上海)股份有限公司(以下简称“沐曦”)IPO 辅导状态已变更为“辅导工作完成”,其上市辅导机构为华泰联合证券。这也意味着沐曦的科创板 IPO 之旅又迈出了重要一步,接下来会提交上市申报材料,准备在 A 股上市。

1 月 15 日,沐曦启动上市辅导,上市辅导机构为华泰联合证券。

沐曦为异构计算提供全栈 GPU 芯片及解决方案,可广泛应用于智算、智慧城市、云计算、自动驾驶、数字孪生、元宇宙等前沿领域。

沐曦官网信息显示:沐曦集成电路(上海)股份有限公司,于 2020 年 9 月成立于上海,并在北京、南京、成都、杭州、深圳、武汉和长沙等地建立了全资子公司暨研发中心。

据企查查信息,沐曦控股股东为上海骄迈企业咨询合伙企业 (有限合伙),持股比例为 22.83%;实际控制人为陈维良,受益股份为 39.26%。

作为沐曦创始人、董事长兼 CEO,陈维良拥有近 20 年的 GPU 芯片设计经验,曾是 AMD 的全球 GPU 设计及产品线的负责人,主导过 15 款高性能 GPU 产品的流片和量产。

据公开资料显示,除了陈维良外,沐曦的创始团队中还有多人来自 AMD。联合创始人、CTO 兼首席硬件架构师彭莉是 AMD 全球首位华人女科学家(Fellow),曾任 AMD 首席架构师,拥有 15 年高性能 GPU 设计经验;联合创始人兼软件 CTO 杨建博士是 AMD 大中华地区第一位科学家(Fellow),历任 AMD、海思等首席架构师,拥有 20 年大规模芯片及 GPU 软硬件设计经验。

在产品方面,沐曦从成立起就专注于高性能 GPU 计算领域。目前公司推出了三大系列 GPU 产品:

  • 曦思 ®N 系列:主要用于智能计算的推理环节;

  • 曦云 ®C 系列:适用于通用计算场景;

  • 曦彩 ®G 系列:专门用于图形渲染。

其中,曦云 ®C 系列的应用范围很广,在国家训练场、商业化智算中心、互联网、运营商、教科研以及自动驾驶等多个领域都有实际应用。

今年 1 月份,上海人工智能实验室推出的书生・浦语 3.0 大模型与沐曦展开合作,借助沐曦的曦云 ®C 系列产品,实现了该大模型的推理和微调训练。

2024 年,沐曦在全国范围内交付了 9 个算力集群,这些集群的布局从华东地区延伸到华中地区,还覆盖了香港。全年累计布局的算力集群总规模超过了一万张 GPU 卡

公司产品均采用 完全自主研发的核心 GPU IP(区别于国内多家 GPU 厂商采用 Imagination 的 GPU IP 授权),拥有完全自主知识产权的指令集和架构,配以兼容主流 GPU 生态的完整软件栈(MXMACA®),具备高能效和高通用性的天然优势,能够为客户构建软硬件一体的全面生态解决方案。

值得一提的是,沐曦最新的 MXC500 曦云系列产品号称对标英伟达 A100 / A800,目标 FP32 算力 15 TFLOPS(英伟达 A100 的 FP32 性能为 19.5 TFLOPS),采用通用 GPU 架构,兼容 CUDA。

但在完成上市辅导消息披露之前,沐曦曾被曝经历过小范围裁员。

今年 2 月,有媒体发文称沐曦开启上市前裁员约 200 人,占其 900 人左右总数的约 20%。

有所谓业内人士认为,此举意在增加上市成功的概率。沐曦在开始上市流程前,就已完成了规模约 20 亿人民币的融资,于 2024 年 12 月份进行了交割。

当时,观察者网就该消息联系沐曦方面,沐曦表示:“为顺应公司发展,该公司会定期开展人员结构调整工作,优化人员配置,此过程有人员的补充与裁撤,均属正常范畴,并非市场传言增加上市概率,市场传言的优化比例也严重失实。”

此外,据杭州余杭金控披露,沐曦 2023 年营收 1.07 亿,亏损 8.46 亿;2024 年营收 12.55 亿,亏损 5 亿

连续五年完成 8 轮融资

自成立以来,沐曦在资本市场一直备受青睐。到目前为止,沐曦累计完成 8 轮融资,融资金额超过 20 亿元人民币。投资方包括上海科创基金、浦东资本、国调基金等国有资本方,以及红杉中国、经纬创投、混沌资本等多家创投资金。

成立仅一个月后,2020 年 10 月,沐曦就完成了天使轮融资,由和利资本、泰达科投联合领投。

次年,2021 年 1 月,沐曦完成由红杉中国、真格基金联合领投的 Pre-A 轮融资,2 月,经纬中国、光速中国联合领投了 Pre-A+ 轮融资。

同年 6 月,沐曦正式完成 A 轮融资,由国调基金、中网投联合领投。据天眼查 App 显示,此外还有复兴锐正资本、联想创投、上海科创基金、招商资本等数十家机构参与了沐曦的该轮融资。

2022 年 7 月,沐曦再启动 10 亿元的 Pre-B 轮融资,由混沌投资、央视融媒体产业投资基金联合领投,前期投资的中网投、经纬创投等资本再次参与其中。

2023 年沐曦筹划了两轮融资,引入的投资方包括中原航港基金、中卫颐和、尼盛国际、启夏资本、科力创投、余杭金控、广发信德、国道金服等。

沐曦自成立后连续五年进行了大额的融资,2024 年 8 月,沐曦完成了目前最后一轮融资,该轮投资方包括浦东资本、上海科创基金、湖南国创产业投资等国有投资方,以及加佳信息、启夏资本等市场企业资本。

国产 GPU 大厂扎堆 IPO

AI 大模型的训练和应用,对计算能力提出了近乎苛刻的要求,而 GPU 凭借其强大的并行计算能力,成为了满足这一需求的关键硬件。国产 GPU 市场在这样的大背景下,竞争呈现出白热化状态,众多厂商纷纷入局,试图在这片充满机遇与挑战的市场中占据一席之地。

目前,国产 AI 芯片的主要参与者主要包括华为海思、寒武纪、海光信息、壁仞、沐曦、燧原股份、摩尔线程、百度、阿里巴巴平头哥等厂商。

华为海思凭借在通信和芯片领域的深厚积累,其昇腾系列 GPU 在特定领域具有较强的竞争力,并依托华为的生态体系,在智能安防、边缘计算等场景得到广泛应用。

寒武纪作为国产 AI 芯片的代表企业之一,在 AI 推理与训练芯片方面技术领先,产品在互联网、智能驾驶等领域逐步实现批量出货。

海光信息的 “深算一号” 等产品,在显存频率和带宽等关键性能指标上不断提升,在一些应用场景中已能与国际同类产品相媲美,且通过与中科曙光的紧密合作,在服务器市场占据一定份额。

新兴的 GPU 厂商如壁仞、沐曦、燧原股份、摩尔线程等也发展迅速。

在沐曦完成上市辅导之前,国产 GPU 大厂燧原科技、壁仞科技、摩尔线程都已经启动上市辅导。

2024 年 8 月,燧原科技在上海证监局办理上市辅导备案,由中金公司辅导。

2024 年 9 月,壁仞科技在上海证监局办理 IPO 辅导备案登记,辅导券商为国泰海通。

2024 年 11 月,摩尔线程启动 A 股上市辅导。2025 年 1 月,沐曦”的辅导备案被登记受理,辅导机构为华泰联合证券。6 月 19 日,摩尔线程已经率先完成了上市辅导。

2025 年 2 月,有消息称壁仞科技考虑港股 IPO,拟募资 3 亿美元,有可能在今年登陆港股。

摩尔线程甚至与沐曦相继在一周内完成了备案辅导,可见这几大 GPU 独角兽都在摩拳擦掌争当“国产 GPU 第一股”。

根据胡润研究院发布的《2024 全球独角兽榜》中。在目前开启辅导备案的芯片独角兽企业中,摩尔线程的估值为 255 亿元,燧原科技的估值为 160 亿元,壁仞科技估值约为 155 亿元,沐曦估值为 100 亿元。

这些新兴国产 GPU 企业之所以能在短时间内拿下高估值,与其技术的快速演进密不可分。随着年初 DeepSeek 的迅速走红,一场围绕国产芯片的适配浪潮随之兴起。

沐曦、摩尔线程、天数智芯、海光信息等多家国产芯片厂商,纷纷宣布完成与 DeepSeek 大模型的适配工作。

DeepSeek 就像一条“鲶鱼”,给国产芯片厂商带来了“翻身”的希望。

摩尔线程专家此前在接受 InfoQ 采访中表示,DeepSeek 的核心突破在于算法优化和计算效率的提升,这种低算力需求模型对国产芯片的发展是一个重要机遇。

首先,DeepSeek 的成功表明,通过模型压缩、稀疏计算、混合精度训练等技术手段降低算力需求,可以在一定程度上弥补硬件性能的不足,为国内芯片提供了软硬件协同设计的新思路,证明了在硬件性能短期内难以赶超的情况下,通过软件层面的创新仍可提升整体计算效能。

其次,DeepSeek 在混合精度训练方面的成功,展示了低精度计算在 AI 训练中的潜力。国内芯片厂商可以借鉴这种模式,优化芯片的计算单元,支持更灵活的精度配置

与此同时,DeepSeek 的开源模式为国产芯片厂商提供了与软件开发者合作的机会。通过与 DeepSeek 等开源模型的合作,国内芯片厂商可以更好地理解 AI 应用的需求,进行针对性优化,国产模型 + 国产芯片可以形成完整的 AI 闭环,加速国产 AI 生态发展进程

另外,DeepSeek 大幅降低 AI 成本,让 AI 更加普及,反过来又会提升对算力规模的需求。整体来看,国产芯片通过聚焦能效比、本地化服务和政策红利,有望在边缘和端侧市场、行业 AI 等场景实现突围

IDC 分析认为,对于顶级开源大模型 DeepSeek 的快速适配对于国产 GPU 行业意义深远,不仅助力中国本土芯片在软件生态领域取得重要突破,显著提升了本土芯片的市场竞争力,还进一步促进了国产芯片厂商间的技术交流与资源共享,打破了长期以来国产芯片生态建设的发展瓶颈。

如今,众多本土芯片厂商以 DeepSeek 为纽带,积极开展合作,携手打造适配本土芯片的软件栈、工具链等生态组件,加速构建自主可控的国产 GPU 生态体系。

(文:AI前线)

发表评论