有导演用AI生成了一部短片,看完后我确定,AI视频的时代来了

AI 大模型的发展还在快速进行中。刚刚,我看到美国导演 Jason Zada 在他的社交媒体平台 X 上发布了一个短片,他表示,这个短片中的所有画面都是由 Google 的最新视频生成模型 Veo 2 生成的。

我看了下,效果很好,我放下面你看看。

看来,2025 年,AI 生成视频将会迎来新的发展阶段。最近,国内外很多公司都在密集推进着自己的视频生成产品,比如快手的可灵、抖音的即梦,还有 OpenAI 的 Sora。说个可能不是共识的观点,从目前我的观察看,谷歌在 AI 生成视频方面,应该是领先 OpenAI 的。Sora 并没有预期中的炸裂。

Jason Zada 是美国著名导游与编剧,他在 2016 年导演的《自杀森林》广受好评,此外,他参与开发的互动体验项目《Take This Lollipop》曾荣获艾美奖,全球观看人数超过 1 亿。

Jason Zada 在 LinkedIn 上透露,为了完成这条视频,他进行了几千次尝试。最终成品的效果令他无比震撼。视频的高质量、稳定性以及与原始提示词的高度一致性都超出了他的预期,让他感到非常惊讶。

当他尝试描述 “80 年代粗犷的纽约” 这一场景时,Google Video 2 总能稳定且完美地呈现出预期效果。他承认视频仍有改进空间,但坚信 Google Video 2 是目前最出色的视频生成模型,其性能远远领先于市场上的其他同类产品。

他特别强调,这部电影在制作过程中并没有引入任何视觉特效(VFX)、剪辑或色彩校正。所有的制作环节,从始至终,都是由 Veo 2 直接完成的。

他说这类工具的出现证明了一个事实:只要掌握了这项技术,有才华的电影制作人就能够将任何可能的创意变为现实。

网友们在观看视频后,纷纷表示赞叹。

Google Veo 2 是最近由 Google DeepMind 发布的新一代视频生成 AI 模型,能够制作出长达两分钟、分辨率高达 4K(4096 x 2160 像素)的视频片段。

Veo 2 在模拟真实物理效果和动态捕捉方面表现出色,它能够精确地模拟运动、流体动力学和光影效果,包括不同的镜头和电影效果,以及细致入微的人类表情。这些特性使得生成的视频片段都极具真实性,几乎可以与真实拍摄的视频相媲美。

此外,Veo 2 还增强了对物理原理的理解,能够更真实地模拟运动和流体动力学,如将咖啡倒入杯子等场景。

Veo 2 还具备根据文本提示生成视频的能力,用户可以简单地通过描述他们想要的场景来指导 AI 创建视频内容。

Veo 2 还配备了高级相机控制功能,能够精确操控相机移动,创造出多样化的镜头风格和视角。

为了确保生成内容的安全性和真实性,Veo 2 生成的视频将嵌入隐形的 SynthID 水印技术。这一技术不仅有助于识别 AI 生成的视频内容,还能有效打击虚假信息的传播,并确保内容的版权归属。

虽然 Veo 2 在技术上取得的进步明显,但 DeepMind 也承认在连贯性和一致性方面仍有提升空间。Veo 2 目前还无法长时间根据复杂提示生成视频。

Veo 2 目前还处于测试阶段,并不完全开放给所有用户使用,它目前通过 Google 的实验性视频创建工具 VideoFX 提供访问,但需要通过邀请制度加入等候名单,而且 Veo 2 的使用仍处于限制状态,在 VideoFX 上,分辨率最高为720p,时长限制为 8 秒。


(文:AI大模型实验室)

发表评论