AI视频生成告别默剧时代！谷歌Veo 3一步生成高质量音画大片，rap、电影、动画片都拿捏

一水发自凹非寺
量子位 | 公众号 QbitAI

谷歌最强视频生成模型Veo 3鲨疯了！

这一次，从画面到对白，全都由AI原生直接生成。

不仅可以拿捏各种影视风格——

请看VCR（花式演绎“We can talk！”）。

还能搞定大段rap——

视频中的Flow只需简单一句话就能搞定，比如“让老人谈论宇宙”。

从画面到口型再到音频，完全以假乱真了。

还在发布会现场，谷歌DeepMind CEO哈萨比斯就激动宣布：

我们终于走出了无声视频生成的时代。现在用户能用自然语言直接描述角色、场景，还能指定对白和语气。

而通过官方demo，我们也看到了Veo 3电影级的音视频能力：

目前Veo 3已在Gemini应用程序中面向Google AI Ultra订阅用户开放，企业用户可以在Vertex AI平台调用。

虽然距离发布会结束才几小时，但一大波网友试玩已新鲜出炉——

说唱、洗脑神曲、烹饪节目花式整活

一上来，脑洞大开的网友们就开始搞起了抽象……

提示词：a video with dialogue of two muffins while baking in an over, the first muffin says “I can’t believe this Veo 3 thing can do dialogue now!”, the second muffin says “AAAAH, a talking muffin!”

两个松饼表情丰富地开始了对话，连口型都能完美对上：

还复古了上世纪80年代的烹饪节目，并带来全新互动方式：

提示词（中译版）：一段20世纪80年代复古电视烹饪节目的视频，主持人是一位65岁左右的英国老太太。她正把面团放在面前的台面上擀着，说道：“现在，这得费点劲儿……”然后，面团变成了一张脸，抬头看着她，用布鲁克林口音说道：“嘿，女士，看着点！我正在努力膨胀。” VHS录像带中的噪音

虽然最后一句话本该是面团的台词（未完全遵照提示），但制作该视频的网友仍然被效果惊到了。

还有我们熟悉的洗脑神曲，连弹舌这种技术活儿都不在话下。(⊙o⊙)

提示词：futuristic russian singer, techo vibes, eclectic tongue thing.

当然，除了这些好玩的，更有古希腊数学家毕达哥拉斯开展新式教学（连小蜜蜂都有）。

提示词：Pythagoras explaining his theorem, in ancient Greece

也能直接用来花式营销，一遍又一遍强调同一个概念，主打一个洗脑。

有网友激动表示，再这样下去Veo 4就和真的没啥区别了。

而另一边，谷歌首席创意技术专家也透露了一些玩法细节。

他测试了一把Veo 3连续生成长视频的能力。

使用首尾帧功能，他最终制作了下面这个1分钟左右的视频：

虽然这里的背景音乐不是由Veo 3生成的，但男主角的自白和各种音效确实有电影内味儿了。

One More Thing

与此同时，谷歌Veo 2也迎来了升级。

最大亮点在于新增了“参考视频”功能，用来保持视频风格统一以及角色形象一致。

还有相机控制、首尾帧、画面扩展、物体添加/移除等其他功能。

这些新功能目前已在Flow工具中部分上线，完整版很快将在Vertex AI平台推出。

最后，你认为谷歌这次的视频AI表现如何呢？

（文：量子位）

一	二	三	四	五	六	日
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30	31

一水 发自 凹非寺量子位 | 公众号 QbitAI

说唱、洗脑神曲、烹饪节目花式整活

One More Thing

发表评论 取消回复

一水发自凹非寺
量子位 | 公众号 QbitAI

发表评论取消回复