AI视频生成告别默剧时代!谷歌Veo 3一步生成高质量音画大片,rap、电影、动画片都拿捏

一水 发自 凹非寺
量子位 | 公众号 QbitAI

谷歌最强视频生成模型Veo 3鲨疯了!

这一次,从画面到对白,全都由AI原生直接生成。

不仅可以拿捏各种影视风格——

请看VCR(花式演绎“We can talk!”)

还能搞定大段rap——

视频中的Flow只需简单一句话就能搞定,比如“让老人谈论宇宙”。

从画面到口型再到音频,完全以假乱真了。

还在发布会现场,谷歌DeepMind CEO哈萨比斯就激动宣布:

我们终于走出了无声视频生成的时代。现在用户能用自然语言直接描述角色、场景,还能指定对白和语气。

而通过官方demo,我们也看到了Veo 3电影级的音视频能力:

目前Veo 3已在Gemini应用程序中面向Google AI Ultra订阅用户开放,企业用户可以在Vertex AI平台调用。

虽然距离发布会结束才几小时,但一大波网友试玩已新鲜出炉——

说唱、洗脑神曲、烹饪节目花式整活

一上来,脑洞大开的网友们就开始搞起了抽象……

提示词:a video with dialogue of two muffins while baking in an over, the first muffin says “I can’t believe this Veo 3 thing can do dialogue now!”, the second muffin says “AAAAH, a talking muffin!”

两个松饼表情丰富地开始了对话,连口型都能完美对上:

还复古了上世纪80年代的烹饪节目,并带来全新互动方式:

提示词(中译版):一段20世纪80年代复古电视烹饪节目的视频,主持人是一位65岁左右的英国老太太。她正把面团放在面前的台面上擀着,说道:“现在,这得费点劲儿……”然后,面团变成了一张脸,抬头看着她,用布鲁克林口音说道:“嘿,女士,看着点!我正在努力膨胀。” VHS录像带中的噪音

虽然最后一句话本该是面团的台词(未完全遵照提示),但制作该视频的网友仍然被效果惊到了。

还有我们熟悉的洗脑神曲,连弹舌这种技术活儿都不在话下。(⊙o⊙)

提示词:futuristic russian singer, techo vibes, eclectic tongue thing.

当然,除了这些好玩的,更有古希腊数学家毕达哥拉斯开展新式教学(连小蜜蜂都有)

提示词:Pythagoras explaining his theorem, in ancient Greece

也能直接用来花式营销,一遍又一遍强调同一个概念,主打一个洗脑。

有网友激动表示,再这样下去Veo 4就和真的没啥区别了。

而另一边,谷歌首席创意技术专家也透露了一些玩法细节。

他测试了一把Veo 3连续生成长视频的能力。

使用首尾帧功能,他最终制作了下面这个1分钟左右的视频:

虽然这里的背景音乐不是由Veo 3生成的,但男主角的自白和各种音效确实有电影内味儿了。

One More Thing

与此同时,谷歌Veo 2也迎来了升级。

最大亮点在于新增了“参考视频”功能,用来保持视频风格统一以及角色形象一致。

还有相机控制、首尾帧、画面扩展、物体添加/移除等其他功能。

这些新功能目前已在Flow工具中部分上线,完整版很快将在Vertex AI平台推出。

最后,你认为谷歌这次的视频AI表现如何呢?

(文:量子位)

发表评论

×

下载每时AI手机APP

 

和大家一起交流AI最新资讯!

立即前往