跳至内容
当 AI 正从二维世界迈向三维空间,一场智能形态的范式转换正在发生。这不仅是计算架构的革新,更是智能形态从 “在计算机里思考世界” 到 “作为物理实体认知世界” 的根本转变。
在这个关键节点,一个新的科技赛道正在从幕后走向台前。
2 月 14 日,Manycore Tech Inc.(杭州群核信息技术有限公司的控股公司,以下简称 “群核科技”)正式向港交所递交招股说明书,冲刺 “全球空间智能第一股”。
成立于 2011 年的群核科技是一家以 AI 技术和 GPU 集群为底座的空间智能企业,已构建一套物理正确的世界模拟器。在过去数年里,群核科技一直专注于空间认知相关技术,去年正式发布了基于三维空间的多模态 CAD 大模型,并通过逼真的虚拟模拟帮助训练复杂模型。这些技术沉淀如今被广泛运用在室内空间场景下的实时渲染、工业生产制造,以及虚拟物理世界训练等场景中。
根据弗若斯特沙利文的资料,按 2023 年的平均月活跃用户 (MAU) 数目计量,群核科技是全球最大的空间设计平台;按 2023 年的收入计量,群核科技亦是中国最大的空间设计软件提供商,约占 22.2% 的市场份额。2024 年,群核科技的平均月活跃访客数为 8630 万名。
公司的三位创始人黄晓煌、陈航、朱皓分别在图形计算、高性能计算和云计算等领域有显著成就具有扎实的技术背景。其中联合创始人兼董事长黄晓煌曾在英伟达担任软件工程师,参与英伟达 CUDA 开发工作。这些技术积累都为公司在空间智能领域的发展奠定了基础。
前一阵子,因为几家杭州科技企业在技术创新上吊打硅谷,群核科技与宇树科技、DeepSeek、游戏科学等杭州科技企业共同被外界称之为 “杭州六小龙”,火速出圈。
今天,”杭州六小龙” 中群核科技率先开启上市之路,也让大家看到了空间智能的巨大发展潜力。正如李飞飞教授定义的 AI 是让计算机拥有 “思考” 的能力,那么空间智能则是赋予 AI “行动” 的能力,这将会重塑从个人生活到产业升级的方方面面。空间智能进入产业规模应用的奇点已来!
二维平面向三维空间的转变,本质上 AI 正在从数字逻辑到物理具身的方向进化。
未来的 AI 竞争可能不再局限于算法优化,而是转向 “如何让智能体在复杂现实中自主生存”—— 这需要空间智能作为底层支撑。
空间智能是 AI 在三维物理世界中落地的 “刚需能力”,而非独立技术分支。其本质是赋予机器理解和处理三维世界的能力,最终使 AI 从数字空间的 “旁观者” 升级为物理空间的 “行动者”。这种能力涵盖了对现实世界的 3D 感知、理解、重建和交互等多个维度。
但要实现这一目标,首先需要解决的核心问题是:如何将物理世界数字化,构建一个可被 AI 理解和处理的 3D 数字空间。
在这个领域,群核科技选择了一条独特的技术进化路径:通过计算机辅助设计软件切入室内设计领域,并延伸向工业 4.0。从 2D 设计图到 3D 场景的转换过程,实际上是一种深度的空间重建和理解,这种能力的积累为群核科技处理更复杂的空间场景提供了重要经验。
十余年间群核积累了海量的设计方案,这些基于物理原理的 2D 图纸及其 3D 空间场景,为空间智能的发展奠定了坚实的数据基础,并形成了一条渐进式的技术演进路径。
更为重要的是,这些积累的数据不仅包含了几何信息,还蕴含着丰富的语义信息。例如,一个简单的门不仅具有特定的尺寸和空间位置,还包含了 “可开关” 这样的功能属性信息。这种既有形态又有语义的数据特征,为 AI 理解空间关系和物体功能提供了关键训练素材。
通过这种方式,一个物理正确、语义丰富的 3D 空间数据库逐步成型,这不仅是空间智能发展的基础设施,也是快速将技术能力扩展到更多广泛领域的关键支撑。基于这样的技术积累,市场上已经看到了多个成熟的商业化产品,空间设计软件(酷家乐)、酷家乐海外版(Coohom)、以及面向室内环境 AI 开发的下一代空间智能解决方案群核空间智能平台(SpatialVerse)。
在群核科技探索空间智能过程中,2018 年是一个重要里程碑。那一年,群核科技联合英国帝国理工大学等名校及机构,在 BMVC 会议上发表的论文中推出 InteriorNet—— 当时全球最大的室内场景认知深度学习数据集。在那个 3D 数据贫乏的年代,InteriorNet 包含 1600 万组像素级标签数据,1.5 万组视频数据,总计约 1.3 亿张图像数据,堪称 “3D 界的 ImageNet”,在学术界引发巨大反响。
彼时,人们还没意识到,空间智能正在成为连接物理世界与数字世界的关键纽带,推动着各个行业向更智能、更高效的方向发展。
事实上,尽管目前空间智能并没有成为主流的技术名词,但它早已充斥不同行业。比如游戏 3D 建模、空间设计、空间感知等等。最早将其带入大众视野的事件是,李飞飞宣布再次创业进入空间智能赛道,目前正在创建 3D 数据集。国内也有公司正在进行积极探索,如各类 3D AIGC 创业公司,昆仑万维此前推出了 Matrix-Zero 世界模型,用于游戏开发中构建虚拟场景。
空间智能的应用也在逐步落地。以我们熟悉的 VR/AR 眼镜为例,其本质是一台可随身携带的空间智能计算机,Meta 通过 Quest 系列和智能眼镜,专注于构建社交导向的空间计算平台,同样,苹果 Vision Pro 也将空间计算定义为下一代生产力工具。一些更底层的技术厂商如英伟达,则基于在智能驾驶芯片的深耕,推出 Cosmos 基础模型,来强化虚实环境的协同能力。
而这些,都需要以空间理解算法为核心,构建一个物理正确的虚拟环境,才能与现实世界相融合。
人工智能的发展依赖于算力、算法和数据的协同增效。在空间智能领域,这一技术框架被重构为空间计算引擎、空间理解算法和空间数据资源三大要素。
招股书显示,目前,群核科技积淀了三项核心技术能力,即专门构建的 GPU 基础设施、先进的人工智能(AI)应用程序以及合成虚拟数据生成。
群核的核心技术突破首先是基于专门构建的 GPU 集群,和自主研发 3D 实时渲染引擎,解决了大规模三维场景的实时交互难题。群核科技创新性地整合了 GPU 集群计算、分布式渲染等技术,并优化计算能力分配,来实现高效的并行处理。在这种高性能计算能力之上,群核科技又基于端云协同、光线追踪、实时渲染等做到了云端实时渲染,并在生成式 AI 技术加持下,可以对物理世界的有机物和无机物实现快速模拟,能渲染真实物理世界 99% 的材质。
而群核科技于 2024 年发布的多模态 CAD 大模型,构成了群核空间智能的大脑。完整的 3D 视觉算法矩阵涵盖了空间重建、目标识别、场景理解等多个维度,用于生成物理正确的结构化 3D 空间,比如自动识别 CAD 图纸、自动生成 3D 场景等。资料显示,这些能力已被应用在家居、电商、广告等空间设计、以及生产制造和落地施工等领域。
作为空间智能持续进化的关键养料,室内空间数据则是群核科技独特的优势。如前文提到的 InteriorNet 数据集已是当时全球最大的室内场景认知深度学习数据集,招股书中还提到群核科技还拥有 3.62 亿个 3D 模型及空间设计元素。这些场景覆盖了从家居到工业的多个应用场景。这些空间数据在合成数据技术经自动化分割和标注、物理与环境增强后,可生成高质量、多样性、可泛化性强的仿真训练数据,为机器人、AI 模型等提供 “训练道场”。
这三大技术支柱之间形成了紧密的协同效应:高性能的空间计算平台支撑着复杂算法的快速运行,成熟的算法体系提升了空间数据的利用效率,而持续扩充的数据资源又推动着算法的迭代优化,从而形成一个完整的技术闭环。
在大模型行业,一直围绕着一个成本魔咒,即前期投入太高,回报周期长,短时间内无法跑出可见的商业模型,导致不断靠融资维持,以此形成恶性循环。2024 年,多家大模型创业公司都因商业进展不顺利而破产。
这意味着,即便是在技术行业,生存依然是第一性原理,发展技术和商业化探索,都是从原点便需要思考的问题。
空间智能的普及,同样如此。不同的是,空间智能本身与落地场景的紧密连接,让它具有原生的商业属性和发展空间。
李飞飞在 TED 演讲中提出的观点道出了空间智能的本质:行动的冲动是具有空间智能的生物与生俱来的特质,空间智能将感知与行动紧密联系在一起。
这一洞察揭示了空间智能不仅是一种技术能力,更是智能体与物理世界互动的基础设施。随着物联网、元宇宙、自动驾驶的普及,AI 对物理世界的理解能力(空间 + 时间 + 因果推理)将逐渐成为标配。
在过去的探索中,群核科技通过持续的技术创新和场景落地,将空间智能技术打造成连接虚实世界的桥梁,推动各个行业向更智能、更高效的方向演进。从家装设计到工业制造,从机器人训练到连锁零售,公司的技术能力在各个领域得到验证。
在工业制造领域,诗尼曼家居的数字化转型案例展示了空间智能在智能制造中的应用价值。通过 AI 智能检测替代人工审核,建立了智审业务数据的管理标准。在连锁零售领域,与喜姐炸串等连锁零售品牌的合作中,通过空间智能的应用赋能商业空间的设计图与施工图输出。跨境电商公司傲基科技借助群核科技 AI 实时渲染能力,实时生成丰富多样的电商图、展示视频等等。
在这个过程中,公司近年来营收保持持续稳健增长。根据招股书显示,2022 年和 2023 年,群核科技的营收分别为 6.01 亿元和 6.64 亿元,同比增长 10.5%;2024 年前三季度的营收则从 2023 年前三季度的 4.86 亿元增加 13.8% 至 5.53 亿元,这一增速已高于 2023 年全年的同比增幅。2022 年、2023 年以及 2024 年前三季度,群核科技的毛利率分别为 72.7%、76.8% 以及 80.4%,呈现持续提升趋势。在群核身上,技术创新与商业价值获得了良性循环。
这种技术延展不仅体现在应用场景的扩展上,更重要的是开创了一种新的智能范式:通过数字世界的多维操控能力,为智能体提供更丰富、更可控的训练环境,最终实现在物理世界中的精确行动。这正是空间智能作为基础设施的核心价值所在。
比如招股书中展示的群核空间智能平台(SpatialVerse),架起数字仿真与物理现实之间的桥梁。SpatialVerse 构建了庞大且物理正确的数据集库,模仿真实世界物理特性和空间关系,使开发者能够在虚拟环境中训练 AI 生成内容 (AIGC) 模型,并增强智能机器人、AR/VR 系统及具身人工智能的认知能力。
由 “稚晖君” 彭志辉参与创办具身智能优秀企业「智元机器人」,便选择了 SpatialVerse 提供的机器人训练数据解决方案,并已取得显著成效。在此之前,SpatialVerse 已与硅谷头部科技企业,以及一批具身智能企业达成合作。
智元机器人在 SpatialVerse 提供的仿真场景中训练
通过持续的技术创新和场景落地,群核科技正在将空间智能技术打造成连接虚实世界的桥梁,推动各个行业向更智能、更高效的方向演进。
这种多场景的应用实践,不仅验证了空间智能技术的可延展性,更展现了其在产业数字化转型中的核心价值。为下一代 AI 的发展,奠定基础。
(文:机器之心)