AI turns static photos into movies
两天前刚写了谷歌的新视频模型Voe2,
评分上超越了可灵1.5,
不到一周,可灵1.6 王者归来了,这版本更新幅度之大我单方面称之为可灵2!
再加上最近AI视频的评估方式有了很大的改变。原来简单的写实类、人物类等已经难不倒T0梯队了。我们连夜测了上百个视频!
这回给咱大家来个直接的,先来个Voe2(Aka 4k版 Sora)最火的几个素材和可灵的对比,咱也直接上文生图。
哦吼?旗鼓相当?Voe2这才上线几天?它有想过一上线对打的就是可灵1.6吗?
重要的是Voe2我还没排上,可灵1.6已经全量上线了啊!
我这几千积分刷刷的就充上了!求个三连补血🙏
这次我们用物理世界、人物动作、人物表演、特效表演、多主体这五个新标准来测测可灵1.6到底有多牛,又到底牛在哪里?Here we go!
一、物理世界
这是最近AI视频最关注的一个新词儿,
其实就是真实世界中物体的运动规律以及物体之间力的作用。
日常实拍的时候肯定不用考虑这些方面,但AI视频不同。对于物理世界的完美展示从而达到对真实世界的复刻,目前也是AI视频追求的重要目标之一。
上来就先切个东西吧(最近都很喜欢用AI切东西)
然后我们来看一个水瓶下落到不同材质的地面上是否会产生预想中的作用效果,
二、人物动作
人物动作这个方面算是老传统了,
但是AI视频在这一方面做的是越来越好,而且可灵1.6这个版本一出场就说在人物动作方面有大幅度的进步!
先来个慢慢的动作,让老头打个太极:
诶?这味儿对!以前Ai视频做不到这个味道的动作,打太极一直都是胡乱舞蹈,但可灵1.6的动作速度以及动作幅度都非常不错,要不是最后手部有一点点幻觉,我都以为是真的有一个老大爷在打太极了。
那再来个速度快的?我直接出个女团跳舞:
我直接放视频,这个效果是我直接跳起来惊呼的程度(没夸张),太!牛!了!除了快速动作时手部会有一点点幻觉,但是这不仅个人solo有眼神杀到我,甚至还能直接来个刀群舞!动作整齐划一,甚至还有站位,请问可灵1.6是背着我们默默啃了多少女团舞?我单方面宣布可灵1.6就是最会跳女团的AI!
如果女团可以的话,那cg肯定不在话下了:
三、人物表演
除了人物动作,目前另一个必测的新维度就是人物表演了,对于各种情绪的正确表达也是AI视频目前逐步攻克的难题。
这次我们就直接来一个,人物【低头没表情的看雪 —— 大笑 —— 痛哭】的三段式情绪变化:
那实拍可以的话,我想试试其他风格表演效果:
出乎意料的,2D动画的效果竟然要比3D效果更好!可能是因为我选的3D动画图和写实风格有些接近,表演最后直接演变成真实人物了。但是2D动画的效果再一次惊艳到我,不管是人物的表情还是背景的运动都完全没有风格的变化。果然,做风格化还是要找可灵!
那如果我把人物换成3D的小动物呢,表演效果会是怎样?
四、特效表演
特效这一块,最近AI视频也逐渐开始有了非常不错的展现,这把也同样看看可灵1.6对于不同类型的特效是否都能高质量的完成。
首先是伴随动作的特效:
再夸一遍可灵的动作幅度和自然度!怎么夸都不腻。
随着人物动作的特效都能有很好的展现,除了剑会软趴趴的问题,整体效果都很不错。
再来施展一下魔法:
最后看两个科技特效:
粒子特效和光线处理的都非常不错,效果稳定,再夸一遍。
五、多主体
关于多主体的展现一直以来也是大家会关心的话题。最关注的应该就是画面中有几个人的时候才不会崩,那我们这次直接玩个有意思的:
10人以内的都不测了,太easy了。这是我给可灵的信心,直接先来十几个人的看看:
那20个人呢:
50个人:
100个人:
给我玩嗨了!整体上看,除了最后100个人的镜头后面的人物会糊掉(这个是我图片的问题),其他的多人物镜头展示的都很不错,最棒的可灵可以识别出哪双手是哪个人的,能给对应的人物设计出合理的挥手动作,这就很牛了!
写在最后
我不得不说,
AI视频的发展真的太快了。
不只是可灵,而是整个行业。
谁还记得今年年初AI视频还是那个只能做4s视频的小学生呢?
可灵这次给我带来的惊喜是巨大的,
再一次燃起了我创作的欲望。
虽然它只是1.5到1.6一个小数点的更新,
但对于我们来说却是一个更强版本的迭代。
就像大家说的那样,
只给自己一个小数点,
是可灵对自己更高的要求,
是不断超越自己的决心,
这是最棒的。
@ 作者 / 阿汤 & 卡尔@ 动手学AI知识库 / learnprompt.pro
(文:卡尔的AI沃茨)