100镜实测新AI视频Hailuo 02,只想说一句:这AI打人真疼

    前天写 MiniMax Agent 的时候,我顺手提了一句,说海螺更新了自家的视频模型 Hailuo 02。

    当时就已经被它的视频打击感给惊艳到了,先给大家看个他们自己的宣传片:

    这动作太牛了。你们懂我这个人,凡是有新功能、有新模型,只要能用,我一定第一时间上手。

    第一波测下来,只有一个感受:What?AI视频现在真能拳拳到肉了?还能练上花滑和体操了?!风格化还超级强?!!



    全能选手啊这是!尤其这个溜冰的镜头我里外里看了十几遍了

    目前模型支持文生视频、图生视频两种模式,分辨率是 768p 和原生非超分的 1080p,支持生成 6 秒和 10 秒时长的视频。

    看了眼AA榜单评分,直接全球第二,图生视频能力超过了可灵2.0和veo3!

    Amazing啊!这我得带着大家一起好好尝尝这个全球第二。

    我们分别从提示语遵循大幅度动作多人动作互动超强风格化的角度依次去测试文生视频能力和图生视频能力表现,

    怒花5000积分,直接上百镜系列,Here we go!

     01|提示语遵循 

    用了这么久的 AI 视频工具,我个人觉得最重要的一项基础能力就是提示语遵循。

    AI 视频模型不“听话”,其他功能再强也很难落地。毕竟我不是让它自由发挥,而是希望它尽可能把我描述的东西呈现出来。

    所以拿到新模型第一件事,就是看看它能不能听懂我的提示语,到底能还原多少细节。

    文生视频

    我们先从文生视频入手,这次我选了一些细节丰富、元素密集的场景,看看 Hailuo 02 的理解力和实现力如何。

    📌提示语:一个戴着宇航员头盔的人在沙漠中行走,左手拿着玫瑰花,右手拿着打开的书,书页随风翻动,远处有一架老式飞机正在降落

    这个镜头在头盔的反光中还能看到人手中拿的书和花,背景中该有的“飞机在降落”也做到了,真的很细节。

    🎉提示语:日落时分的草原,一位戴牛仔帽的骑手策马跃过溪流,马蹄溅起金色水花,镜头跟随骑手运动,背景有狼群在远处山丘奔跑,全程保持电影级光影质感

    马蹄溅起的水花、背景中的“狼群奔跑”,整个画面完成度很高,看着非常西部牛仔。

    有些模型只通过文字做出的画面就很不自然,AI味儿很重,但Hailuo 02明显没有。

    图生视频

    图生视频,我就要上点难度了,主要是考察 Hailuo 02 对复杂时序动作的处理能力,看看是否能维持画面一致性的同时还原动作变化。

    📌提示语:城市从日出到正午再到傍晚夜幕降临,再到灯火辉煌的完整变化过程

    这个延时镜头在镜头有所运动和光影持续变化的情况下依然能保持城市的一致性,时间流逝感做的很好。

    📌提示语:小女孩在游乐场吹泡泡,镜头跟随气泡飞起上升,同时展现两个气泡内分别是一个初中生在学校上课的场景和一个20岁女孩在工作的场景

    这条我故意没说“初中女生”,看看模型能不能自己推理出气泡内人物身份。结果是两个都是女孩的画面,而且穿着、场景都符合预期。

    📌提示语:一个魔术师把帽子变成一束花,再把花束变成小兔子,最后把小兔子变成一把彩色的雨伞,周围走上来几个人鼓掌

    变魔术这种含复杂物体变形和多阶段动作的提示,已经属于高难度场景。前三个镜头大致完成,第一个变帽子、第二个变兔子都非常准确,除了第三下把小兔子扔出去了,其他的都很好。

    整体下来,我的感受是对于提示语的遵循程度能达到85%左右,能听话,还能理解细节,很靠谱。

     02|大幅度动作 

    重点来了!眼睛要睁起来!

    我必须说,Hailuo 02 在“大幅度动作”这一块真的把我打服了。

    不光是动作多,还很“稳”,能实现合乎逻辑的物理规律,同时还保持强大的稳定性。

    文生视频

    📌提示语:在现代城市楼顶,镜头跟随一名跑酷高手在楼宇之间奔跑,然后连续完成高空飞跃、后空翻,最终在一根狭窄护栏上稳稳落地并向镜头招手。

    稳稳当当,我想直接给鼓个掌,这个起跑、跳跃、后空翻、落地、挥手,一气呵成。

    下面来两个更高难度的花滑动作和体操动作来和之前广受好评的Veo3对比一下效果。

    🎉提示语:花样滑冰运动员高速滑行后起跳,完成高难度动作后落冰,冰刀在冰面划出完美弧线,冰屑飞溅。
    🎉提示语:一名体操运动员在赛场的单杠上完成比赛动作,最后连续三次空翻后完美落地。

    猜出来了吗?左边都是 Hailuo 02!这结果一目了然(说实在的,我没想到Veo3能拉成这样。。又给我搞变身又给我搞分身。。。。)

    然后我要夸夸Hailuo 02,花滑这个不仅有起跳的动势,在高难度动作处做出了慢动作(我直接幻视比赛回放),而且落地稳稳当当。

    体操这个更不用说了,动作、单杠的回弹效果、运动员落地姿势都堪称完美,甚至它还给我做出了五环。。。。

    图生视频

    其实看到上面的对比就能感受到,目前AI视频大幅度动作面临的难题就是,要在人物进行大动作时保持人物的肢体面部既符合物理规律又不扭曲模糊甚至崩坏分裂。

    这一点,在图生视频上就要更难实现,因为还需要保持人物和场景与原图一致,你不能在动的时候把人脸“甩变形”、不能让衣服自己飘没、也不能动着动着场景就变了。


    提示语:一个侠客在耍剑,帅气的身姿

    这把剑终于不再是软趴趴了,终于能够感受它是金属的质感了,而且人物的面部保持的很好,耍剑的动作也是有模有样的,感觉有被帅到。

    🎉提示语:起跑枪响,运动员如离弦之箭冲出,快速奔跑冲向终点,镜头跟随运动员移动,比赛摄影

    我合理怀疑Hailuo 02在做比赛视频这一块做了什么特殊的训练,不管是上面的体操还是这个短跑比赛,这个动感和氛围都很到位,尤其是起跑的时候还有一个预备的动势,关键是这么大幅度的奔跑,腿部都不会有模糊和错位的现象,人物的一致性保持也非常稳定。

     03|多人动作互动 

    多人场景必须上对打,必须打起来。

    之前的AI视频很难做多人物的对打场景,打架看起来没有什么力量感,不够真实。

    这次我就把这个难题搬给Hailuo 02试试看。

    文生视频

    📌提示语:电影场景,夜晚昏暗的灯光,在废弃的仓库中,两个男人在激烈的追逐对打,镜头跟随他们移动
    🎉提示语:在倾盆大雨的巷弄里,两名特工徒手搏斗激烈的奔跑对打,镜头跟随他们移动,每一次拳脚碰撞都带起雨水涟漪。

    我直接来两个不同场景的对打戏,两个场景氛围感都非常足,这个对打招式都是有来有回,互相能接住,雨水因为动作碰撞而溅起的效果做的也很自然,感觉以后用AI视频做打戏有希望了。

    图生视频

    然后我们再看看图生视频表现:

    🎹提示语:一个男人一脚把另一个男人踹飞摔倒墙上,电影场景

    提示语非常朴素,但是效果真的还可以,这一脚感觉非常有劲儿,人物摔倒墙上的感觉、墙上溅起的灰尘都很真实。

    🎉提示语:两个拳击手在打拳击比赛,动作非常有力量感拳拳到肉的感觉

    拳击这个打的也痛,这是真的拳拳到肉,非常有动感和打在肉上的实感。

    这里还有一个海外网友做的拳击效果,近景镜头这个出拳力度也非常到位。

    📌提示语:拔河比赛,绳子大幅度来回移动,最后队员集体被拉倒摔倒成一团。

    再放个好玩的,拔河这个场景做的也非常有意思,来回拽绳子的动感有,最后被拽的摔倒了的画面人物也一个接一个,没有糊在一起。

     04|超强风格化 

    惊喜!大惊喜!

    我在测试之前没想过Hailuo 02除了运动强之外,对于风格化视频的生成和一致性保持能强到这种程度!

    直接放几个我最喜欢的case。

    文生视频

    🏆提示语:使用定格黏土动画风,一只蓝色兔子与粉色狐狸在手工质感的小山丘上对话,角色和道具都带有黏土的指痕与手工纹理,表情与动作在镜头切换间仍保持一致。

    这个真的好可爱,而且定格动画的感觉做的非常对味,角色之间的互动也好。

    💡16-bit像素英雄角色(戴红帽穿蓝工装裤)在森林场景中奔跑、穿越山洞后遇到BOSS喷火龙(均为点阵像素风格,运动帧需流畅连贯)

    你怎么知道戴红帽穿蓝工装裤的16-bit像素英雄角色就是马里奥的(偷笑),这个场景我感觉小时候抱过我,这不就是我玩的游戏吗请问。

    💡中国水墨动画,一位长须飘然、身着宽袖青袍的老者(手持蛇形杖)独立寒山之巅,水墨晕染的鹤群绕山飞过,老者杖尖轻点云海,水面泛起墨色涟漪扩散

    看到这个画面的时候我都愣了,无论是形象、动作、水墨的痕迹、要不是有几只鹤中间消失了,我真的觉得是之前传统动作制作才能做出的画面,更重要的是,这个画面我是一次生成的。

    💡吉卜力风格动画,骑着扫帚的红发少女(刘海有X形发夹,雀斑脸)在阳光灿烂的云海中飞行穿梭追逐魔法信鸽,背景有漂浮的蒸汽城堡,镜头时远时近的跟随少女移动,电影级运镜

    吉卜力风格做的也很棒,尤其当女孩的脸飞近镜头的时候,细节展现的非常好。

    图生视频

    图生视频这里我就直接给大家放效果了,提示语很简单只需要描述图中人物怎么动就好了。

    我放出来的每一个case我都超爱,这个关羽虽然动起来水墨的质感减少了一些,但是这小表情太生动太逼真了,我都能感受到这个小风扇的舒适凉爽之意。

    其他的风格保持的也都很好,我觉得都没啥挑的地方,而且基本上这种效果一两次都能生成出来,成功率非常高。


    最后意犹未尽的再放几个海外博主做的case给大家看个够,

    这个风格一致性保持的真好,动作大、特效什么的都很自然。

    写在最后 

    写到这里,其实我脑子里已经开始琢磨:

    要不干脆用它来做下个月那个项目的分镜试试?

    或者,再挑战点啥以前碰壁的东西?

    因为这次跑下来,

    我是真的有种“工具的底已经托得住想象力了”的感觉。

    它不只是帮你出一个视频,而是真的开始让你重新考虑:

    你能写的 prompt 还能有多复杂,你能画的世界还能有多大胆。

    每一帧跑出来的画面都在提醒我,

    AI 视频的那道“临界线”正在被推着往前挪。

    从“看上去能动”到“真的能演戏”;

    从“做个轮廓”到“能打节奏、能控风格”;

    甚至你想做成 3D 动画、水墨动画、像素游戏,

    Hailuo 02 现在都可以给出一个像样的起点。

    就像是有时候,

    AI 给到你的不是一个答案,是一个推你一把的理由。

    你坐在屏幕前,憋着一个点子很久,

    忽然模型一下子把那个场景给你跑出来了!

    你会觉得自己不是在用工具,

    而是真的有人在跟你搭戏,一起演下去。

    所以我就特别想继续写、继续跑,

    因为那种感受太美妙了。

    就像你拿到了一个更好用的相机,你会忍不住一直拍下去一样。

    不是为了“炫技”,而是为了确认那种:

    你真的能拍、你真的能剪、你真的能讲故事的感觉。

    这年头,很少有一个模型会让你拍着大腿说:

    啊,我是真的想拿它好好做个东西。

    但 Hailuo 02,

    这次做到了。


    @ 作者 /阿汤 &卡尔@ 动手学AI知识库 / learnprompt.pro


    (文:卡尔的AI沃茨)

    发表评论