
从OpenAI 的 4o 到 Stable Diffusion,能够根据文本提示生成逼真图像的 AI 基础模型如今已比比皆是。相比之下,能够仅凭文本提示就生成完整、连贯的 3D 在线环境的基础模型才刚刚崭露头角。
不过,这些模型何时会普及只是时间问题。如今,欧洲最杰出的AI 3D 模型研究者之一、慕尼黑工业大学视觉计算与 AI 实验室的马蒂亚斯·尼斯纳(Matthias Niessner)已申请创业休假,创立了一家该领域的初创公司:SpAItial。
尼斯纳曾是 AI 虚拟形象公司 Synthesia( 估值 21 亿美元 )的联合创始人,此次他为这家欧洲初创企业筹集了 1300 万美元的超大额种子轮融资。
领投方是欧洲知名早期投资机构 Earlybird Venture Capital(曾投资 UiPath 和 Peak Games 等),Speedinvest 和多位知名天使投资人也参与了本轮融资。考虑到SpAItial 目前仅发布了一段展示文本生成 3D 房间的概念视频 ,这一融资规模更显惊人。
但尼斯特组建的技术团队同样不容小觑:里卡多·马丁–布鲁亚曾参与开发谷歌 3D 远程会议平台( 现更名为 Beam);大卫·诺沃特尼在 Meta 任职六年期间,主导了公司文本转 3D 资产生成项目的开发。
这支团队的综合实力使他们在追求逼真度的赛道中具备竞争力。
当前该领域已有类似竞争者,例如融资2700 万美元、 主攻娱乐应用场景的 Odyssey;还有由 AI 先驱李飞飞创立的 World Labs,这家初创公司估值已超 10 亿美元 。
尼斯特认为,与其他基础模型赛道的竞争态势相比,当前竞争仍属温和,这也契合了他与同行们追求的“更宏大愿景“。
“我不仅要创造 3D 世界,还要让这个世界像现实世界一样运作。我希望它能实现交互、允许用户在其中操作——目前还没有人真正攻克这个难题。“他说道。
图片来源:SpAItial
从虚拟游戏到现实世界
目前尚未有人真正摸清对照片级真实感3D 环境的市场需求规模。从数字孪生到增强现实,这个号称“万亿美元“的机遇足以让风投们兴奋,但其模糊性和多面性也使得市场进入策略难以厘清。
最显而易见的应用场景是电子游戏开发,不过这类模型还能应用于娱乐产业、建筑领域的 3D 可视化,最终或将拓展至机器人训练等现实世界应用场景。
尼瑟希望通过让开发者授权使用基础模型来开发特定用途的下游应用,从而规避这一问题。他还邀请第四位联合创始人卢克·罗杰斯加入团队——这位前 Cazoo 高管曾在他作为斯坦福大学客座助理教授期间与其在帕洛阿尔托合租公寓,现负责协助处理商业事务。
SpAItial 路线图上的首要任务之一,是区分出哪些合作伙伴能使用早期模型,哪些需要等待更高质量的版本。
我们至少希望与少数合作伙伴展开合作,“Niessner 表示,“观察他们如何运用这些 API 接口。
与其他资金充裕的AI 初创企业不同,SpAItial 将营收置于更优先的位置。但首先需要投入资金,包括算力采购和人才招募。在人才方面更注重质量而非数量。Niessner 强调:“团队规模不会立即扩张至数百人,这既不现实也无必要。“
相反,Niessner 与联合创始人正致力于生成更大规模、更具交互性的 3D 空间——例如让玻璃能以真实物理方式破碎。这将实现 Niessner 口中的“圣杯“:让 10 岁孩子只需输入文字,就能在 10 分钟内制作出自己的电子游戏。
在他看来,这个雄心勃勃的目标实际上比那些唾手可得的成果——比如让用户创建 3D 物体 ——更有可能实现,因为大多数游戏平台仍严格限制第三方内容的添加。当然,除非他们决定像 Roblox 那样自主开发。
但到那时,SpAItial 或许已在忙着取代 CAD 软件了;3D 生成技术的下一个篇章才刚刚拉开序幕。
参考资料
https://techcrunch.com/2025/05/26/one-of-europes-top-ai-researchers-raised-a-13m-seed-to-crack-the-holy-grail-of-models/
编译:ChatGPT
(文:Z Potentials)