李飞飞:World Labs这样实现「空间智能」
斯坦福大学教授李飞飞在人工智能顶会NeurIPS上分享了她的研究,她创立的世界实验室致力于生成3D场景并具备空间智能。她认为机器视觉正朝着全面智能迈出关键一步。
斯坦福大学教授李飞飞在人工智能顶会NeurIPS上分享了她的研究,她创立的世界实验室致力于生成3D场景并具备空间智能。她认为机器视觉正朝着全面智能迈出关键一步。
李飞飞创办的 World Labs 发布了首个「空间智能」模型,只需一张图片就能生成一个完整的3D世界。该模型具有场景持久性、物理规则准确和实时交互能力,引发了广泛赞叹与应用前景讨论。
李飞飞教授联合创办的世界实验室发布了首个‘空间智能’模型,该模型结合深度学习与计算机图形学实现了逼真的三维场景生成,覆盖影视制作、游戏开发、建筑设计等多个领域,并提出了潜在风险和解决方案。
World Labs 推出首个项目:通过单张图片生成互动3D场景的人工智能系统,该技术可以在浏览器中实时渲染并具有可调节的景深效果,有望改变电影、游戏及模拟器制作方式。
文章介绍了五项创新技术与工具,包括World Labs的3D场景生成、Dippy Empathetic Speech Subnet用于沉浸式对话、StoryTeller针对长视频描述的技术、ComfyUI-KLingAI-API让用户直接使用KLing AI API以及Flow作为轻量级任务引擎简化AI代理构建。
斯坦福教授李飞飞发布首个项目World Labs,能用单张图片、一句话生成3D世界。该技术可提高内容控制力和一致性,改变电影、游戏等制作方式。