速递｜将2D照片转化为3D视频，新模型能否解决Stability AI商业困境

图片来源：Stability AI

Stability AI 发布了一款新 AI 模型——Stable Virtual Camera，该公司宣称该模型能将 2D 图像转化为，具有真实深度和视角的“沉浸式”视频。

虚拟相机是数字电影制作和 3D 动画中常用的工具，用于实时捕捉和导航场景。Stability 公司在博客文章中表示，通过 Stable Virtual Camera，他们旨在将生成式 AI 融入其中，以提供更高的控制性和可定制性。

Stable Virtual Camera 从一张或多张图像（最多 32 张）生成用户指定角度的场景“新视角”。该模型可以生成沿着“动态”摄像机路径或预设路径的视频，包括“螺旋”、“推拉变焦”、“移动”和“平移”。

与Arm合作推出音频生成模型后，持续发布新视频模型

当前版本的 Stable Virtual Camera，作为研究预览，能够生成正方形（1:1）、竖屏（9:16）和横屏（16:9）比例的视频，长度可达 1000 帧。然而，Stability 提醒，该模型在某些场景下可能产生较低质量的结果，特别是在包含人物、动物或“动态纹理”（如水面）的图像中。

“高度模糊的场景、与物体或表面相交的复杂相机路径，以及不规则形状的物体，都可能导致闪烁伪影，”Stability 在其博客文章中指出，“尤其是当目标视点与输入图像差异显著时。”

Stable Virtual Camera 可供研究用途，采用非商业许可。可从 AI 开发平台 Hugging Face 下载。

Stability，这家备受困扰的公司，因其广受欢迎的图像生成模型 Stable Diffusion 而闻名。

去年在包括埃里克·施密特和 Napster 创始人肖恩·帕克在内的投资者支持下筹集了新资金，以期扭转公司局面。

据报道，Stability 的联合创始人兼前CEO Emad Mostaque 管理不善，导致公司陷入财务困境，员工辞职，与 Canva 的合作告吹，投资者对公司前景感到担忧。

在过去几个月里，Stability 聘请了一位新 CEO，任命《泰坦尼克号》导演 James Cameron 加入其董事会，并发布了多款新的图像生成模型。

今年 3 月初，该公司与芯片制造商 Arm 合作，推出了一款 AI 模型，该模型能在搭载 Arm 芯片的移动设备上生成音频，包括音效。

本文翻译自：https://techcrunch.com/2025/03/18/stability-ais-new-ai-model-turns-photos-into-3d-scenes/

编译：ChatGPT

——-

（文：Z Potentials）