今天凌晨1点,谷歌DeepMind终于将大家期待已久的Veo 2整合到GeminiApp应用中,全面开放使用。
Veo 2可以最高生成8秒720P电影级视频,在运镜、文本语义还原、物理模拟、动作一致性等方面非常优秀,同时支持图片转视频功能。
根据谷歌公布的测试数据显示,Veo 2在用户偏好和提示还原方面已经超过了Sora、可灵1.5、Meta Movie Gen和Minimax。此外,从今天开始开发人员可以在Google AI Studio中通过API使用Veo 2。

API详细地址:https://ai.google.dev/gemini-api/docs/video?hl=zh-cn
下面先为大家展示一下Veo 2生成的视频。由于平台压缩的原因,视频可能会有点模糊,但视频都是720P的。
提示词:太阳缓缓升起,映照在摆盘精致的早餐场景背后。浓稠金黄的枫糖浆以慢动作的方式倾倒在一叠松软的煎饼上,每一块煎饼都升腾起一缕轻柔温暖的蒸汽。镜头拉近,酥脆的培根发出滋滋的声响,细小的金色油星溅入空中。
咖啡如丝般顺滑地打着旋儿注入晶莹剔透的杯子里,深棕色的咖啡油脂在杯中层层泛起。画面最后,镜头迅速俯冲到一个刚切开的橙子上,以令人惊叹的微距细节展现出它色泽鲜亮、汁水饱满的果肉瓣。
一只戴着超大眼镜的小老鼠在舒适的森林巢穴里,在蘑菇的灯光下看书的动画镜头。
一个宽广且缓慢平移的镜头,拍摄一个巨大的冰川洞穴,整个洞穴沉浸在诡异的暮色之中。淡青色的光线从上方透进来,照亮了冰壁内那些由冰雕成的糖果模样的造型。
两个身着白色外骨骼防护服的人物,他们头盔上的灯光射出一道道光束,艰难地从洞穴中央走过。要捕捉到这个洞穴的宏伟规模和静谧氛围。
一个航拍镜头,展现了一片长满青草的悬崖延伸至一片沙滩,海浪拍打着岸边。在靠近沙滩的海面,一座醒目的海蚀柱矗立着,沐浴在日出或日落时分温暖的金色光芒中,捕捉到了太平洋海岸线宁静的美丽景致。
镜头缓缓飘过一排排漆成柔和色调的木质蜂箱,嗡嗡作响的蜜蜂轻盈地飞进飞出画面。镜头移动后聚焦在正中央一位气质优雅的养蜂人身上,他那身洁白无瑕的养蜂服在午后的金色阳光下闪闪发光。他举起一罐蜂蜜,微微倾斜,让光线映照在罐上。
在他身后,高大的向日葵在微风中有节奏地摇曳,花瓣在温暖的阳光下熠熠生辉。镜头向上仰拍,展现出一座带有薄荷绿色百叶窗的复古农舍,摇曳的树木在农舍的墙壁上投下斑驳的光影。此镜头采用 35 毫米镜头搭配柯达 Portra 400 胶卷拍摄,金色的光线在养蜂人的手套、果酱罐以及蜂箱那饱经风霜的木质表面上营造出丰富的质感。
镜头呈螺旋状向下穿过一个由发光丝线构成的无尽网络,这些丝线闪烁着五彩斑斓的光芒。整个场景仿佛充满了生机,每一根丝线都伴随着微弱的低语声以及如分形图案、神话中的野兽和天体星图等影像的闪现而微微颤动。
信使在这个迷宫般的丝线网络中急速穿行,其轮廓被丝线那万花筒般的光芒所勾勒。当他们在丝线间穿梭时,每一次触碰都会触发动画效果 —— 其中一个是一只闪闪发光的凤凰。
也可以直接将一张图片转换成视频,例如,上传一张香水瓶子的图片,然后输入提示词:制作一个展示香水瓶的奢华宣传视频。视频开场以紧贴香水瓶的近景镜头,缓慢向左移动,聚焦于盛满琥珀色液体的透明玻璃香水瓶的多面切割瓶盖。

玻璃上微微附着着水滴,香水瓶置于洁净的白色大理石浴室台面上。柔和的自然光从背景的窗户洒入,照亮了整个场景。瓶子周围巧妙地摆放着尤加利叶和天然木质香薰棒。整体氛围优雅、清新且高贵。
网友表示,我很喜欢 Gemini,但我认为(比 Sora 要好得多的)视频生成功能不会像 ChatGPT 那样迅速走红。因为你们没有充分利用自身的市场影响力,至少做到每天免费提供两个视频。如果你们能免费提供这项服务,它就有可能迅速走红并吸引到订阅用户。

你们团队正在研发像 4o 那样的具备推理能力的图像生成模型吗?要是能和 Veo 2 搭配使用的话,那效果肯定会非常惊人。
4o 图像生成模型相对于 Imagen 的地位,就如同Veo 2相对于Sora的地位一样。
考虑到一旦我订阅换成 Gemini,就会失去4o图像生成功能,我实在拿不准要不要换。

八秒钟的时间不长,但我敢打赌人们会创作出一些真正了不起的作品。
迫不及待地想看看会有什么样的杰作从Veo 2中诞生了。

这质量简直绝了。Veo 2 实际上很可能会彻底改变游戏规则

开发人员使用Veo 2也比较简单,只要输入你的谷歌API Key,然后设置选择要使用的模型、示例,设置宽高比16:9或者9:16。

一般代码运行2分钟左右就能看到生成的示例视频,这说明API已经连接成功了。
需要注意的是,生成的视频会在谷歌服务器上存储2天,之后就会被移除。如果您想保存生成的视频的本地副本,则必须在生成后的2天内运行result() 和 save()。
(文:AIGC开放社区)