一水 发自 凹非寺
量子位 | 公众号 QbitAI
谷歌最强视频生成模型Veo 3鲨疯了!
这一次,从画面到对白,全都由AI原生直接生成。
不仅可以拿捏各种影视风格——
请看VCR(花式演绎“We can talk!”)。
还能搞定大段rap——
视频中的Flow只需简单一句话就能搞定,比如“让老人谈论宇宙”。
从画面到口型再到音频,完全以假乱真了。
还在发布会现场,谷歌DeepMind CEO哈萨比斯就激动宣布:
我们终于走出了无声视频生成的时代。现在用户能用自然语言直接描述角色、场景,还能指定对白和语气。
而通过官方demo,我们也看到了Veo 3电影级的音视频能力:
目前Veo 3已在Gemini应用程序中面向Google AI Ultra订阅用户开放,企业用户可以在Vertex AI平台调用。
虽然距离发布会结束才几小时,但一大波网友试玩已新鲜出炉——
说唱、洗脑神曲、烹饪节目花式整活
一上来,脑洞大开的网友们就开始搞起了抽象……
提示词:a video with dialogue of two muffins while baking in an over, the first muffin says “I can’t believe this Veo 3 thing can do dialogue now!”, the second muffin says “AAAAH, a talking muffin!”
两个松饼表情丰富地开始了对话,连口型都能完美对上:
还复古了上世纪80年代的烹饪节目,并带来全新互动方式:
提示词(中译版):一段20世纪80年代复古电视烹饪节目的视频,主持人是一位65岁左右的英国老太太。她正把面团放在面前的台面上擀着,说道:“现在,这得费点劲儿……”然后,面团变成了一张脸,抬头看着她,用布鲁克林口音说道:“嘿,女士,看着点!我正在努力膨胀。” VHS录像带中的噪音
虽然最后一句话本该是面团的台词(未完全遵照提示),但制作该视频的网友仍然被效果惊到了。

还有我们熟悉的洗脑神曲,连弹舌这种技术活儿都不在话下。(⊙o⊙)
提示词:futuristic russian singer, techo vibes, eclectic tongue thing.
当然,除了这些好玩的,更有古希腊数学家毕达哥拉斯开展新式教学(连小蜜蜂都有)。
提示词:Pythagoras explaining his theorem, in ancient Greece
也能直接用来花式营销,一遍又一遍强调同一个概念,主打一个洗脑。
有网友激动表示,再这样下去Veo 4就和真的没啥区别了。

而另一边,谷歌首席创意技术专家也透露了一些玩法细节。
他测试了一把Veo 3连续生成长视频的能力。
使用首尾帧功能,他最终制作了下面这个1分钟左右的视频:
虽然这里的背景音乐不是由Veo 3生成的,但男主角的自白和各种音效确实有电影内味儿了。

One More Thing
与此同时,谷歌Veo 2也迎来了升级。
最大亮点在于新增了“参考视频”功能,用来保持视频风格统一以及角色形象一致。


还有相机控制、首尾帧、画面扩展、物体添加/移除等其他功能。
这些新功能目前已在Flow工具中部分上线,完整版很快将在Vertex AI平台推出。
最后,你认为谷歌这次的视频AI表现如何呢?
(文:量子位)