有导演用AI生成了一部短片，看完后我确定，AI视频的时代来了

AI 大模型的发展还在快速进行中。刚刚，我看到美国导演 Jason Zada 在他的社交媒体平台 X 上发布了一个短片，他表示，这个短片中的所有画面都是由 Google 的最新视频生成模型 Veo 2 生成的。

我看了下，效果很好，我放下面你看看。

看来，2025 年，AI 生成视频将会迎来新的发展阶段。最近，国内外很多公司都在密集推进着自己的视频生成产品，比如快手的可灵、抖音的即梦，还有 OpenAI 的 Sora。说个可能不是共识的观点，从目前我的观察看，谷歌在 AI 生成视频方面，应该是领先 OpenAI 的。Sora 并没有预期中的炸裂。

Jason Zada 是美国著名导游与编剧，他在 2016 年导演的《自杀森林》广受好评，此外，他参与开发的互动体验项目《Take This Lollipop》曾荣获艾美奖，全球观看人数超过 1 亿。

Jason Zada 在 LinkedIn 上透露，为了完成这条视频，他进行了几千次尝试。最终成品的效果令他无比震撼。视频的高质量、稳定性以及与原始提示词的高度一致性都超出了他的预期，让他感到非常惊讶。

当他尝试描述 “80 年代粗犷的纽约” 这一场景时，Google Video 2 总能稳定且完美地呈现出预期效果。他承认视频仍有改进空间，但坚信 Google Video 2 是目前最出色的视频生成模型，其性能远远领先于市场上的其他同类产品。

他特别强调，这部电影在制作过程中并没有引入任何视觉特效（VFX）、剪辑或色彩校正。所有的制作环节，从始至终，都是由 Veo 2 直接完成的。

他说这类工具的出现证明了一个事实：只要掌握了这项技术，有才华的电影制作人就能够将任何可能的创意变为现实。

网友们在观看视频后，纷纷表示赞叹。

Google Veo 2 是最近由 Google DeepMind 发布的新一代视频生成 AI 模型，能够制作出长达两分钟、分辨率高达 4K（4096 x 2160 像素）的视频片段。

Veo 2 在模拟真实物理效果和动态捕捉方面表现出色，它能够精确地模拟运动、流体动力学和光影效果，包括不同的镜头和电影效果，以及细致入微的人类表情。这些特性使得生成的视频片段都极具真实性，几乎可以与真实拍摄的视频相媲美。

此外，Veo 2 还增强了对物理原理的理解，能够更真实地模拟运动和流体动力学，如将咖啡倒入杯子等场景。

Veo 2 还具备根据文本提示生成视频的能力，用户可以简单地通过描述他们想要的场景来指导 AI 创建视频内容。

Veo 2 还配备了高级相机控制功能，能够精确操控相机移动，创造出多样化的镜头风格和视角。

为了确保生成内容的安全性和真实性，Veo 2 生成的视频将嵌入隐形的 SynthID 水印技术。这一技术不仅有助于识别 AI 生成的视频内容，还能有效打击虚假信息的传播，并确保内容的版权归属。

虽然 Veo 2 在技术上取得的进步明显，但 DeepMind 也承认在连贯性和一致性方面仍有提升空间。Veo 2 目前还无法长时间根据复杂提示生成视频。

Veo 2 目前还处于测试阶段，并不完全开放给所有用户使用，它目前通过 Google 的实验性视频创建工具 VideoFX 提供访问，但需要通过邀请制度加入等候名单，而且 Veo 2 的使用仍处于限制状态，在 VideoFX 上，分辨率最高为720p，时长限制为 8 秒。

（文：AI大模型实验室）

一	二	三	四	五	六	日
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30	31

发表评论 取消回复

发表评论取消回复