一手评测Seedance 1.0 pro,字节首次登顶视频大模型竞技场的大杀器来了。

人在火山引擎发布会现场,会上令人头晕目眩的发了一堆东西。

豆包大模型1.6、豆包视频生成模型Seedance 1.0 pro、语音播客模型,以及端到端语音模型等等。

火山还是火山,真的,储备实在太多了。

其中大部分都写过了,比如语音播客模型,就是前几天我写的扣子的AI播客,底层就是这个。

而这次,我觉得比较新的,最酷的,还是这个视频生成模型Seedance 1.0 pro。

这玩意前几天屠榜了,虽然名字不一样,但其实就是一个东西。

当时榜单一出,很多朋友立刻就坐不住了。

好多金融的朋友的也第一时间跑来问我。

不过我也不好说啥= =说啥都是泄密。

其实我上周末,就拿到了这个模型的内测,就是即梦AI上的视频3.0 Pro。

已经爽玩了几天了。

之前很火的即梦AI 视频3.0,其实就是Seedance 1.0 lite,即梦AI 视频3.0的评测可以看之前汗青写的:一手实测即梦AI视频3.0,质量全面提升,极致性价比的六边形战士

而这次,即梦AI视频3.0 pro,也就是Seedance 1.0 pro,我也测了一堆case,先说结论:

跟汗青的评价一样,更水桶更纯粹的六边形战士。

我也放出我的评测,希望能给到你们一些,对于Seedance 1.0 pro的客观认知。

话不多说,正式开始。

这次测评,我总共分了这么几个维度:

1. 多镜头组合

2. 运动质量

3. 情绪表演

4. 运镜

5. 物理动态效果

6. 风格化

一个一个来说。

一. 多镜头组合

这也可以算是字节视频模型一贯的特色了,可以直接在视频中切换分镜。

比如我有这么一张图。

我就给他写了一段Prompt:

狮子穿绒面西装坐在敞篷老爷车内,镜头从侧前方仰角缓缓逼近,他稳坐驾驶位,头微微偏向镜头方向,风吹起鬃毛,阳光强烈,墨镜反射出云影与废土景色,他一动不动,像在等某个信号。

镜头切换。

镜头切至车内俯拍,狮子抬手慢慢摘下墨镜,眼神直视镜头,手指敲打方向盘,背景响起远处引擎声,他轻抿嘴角,缓缓转头望向远方公路尽头,轻声说了一句台词:「他们终于来了。」

镜头切换。

镜头拉远至正后方低位跟拍,车启动、尾气喷出,他缓慢驶离镜头,背影渐远,前方云层压低,天空突变,镜头最后定格在一块路牌上:WELCOME BACK, KING.

这里其实能看出来,我用了两次镜头切换,“镜头切换”就是触发词,你写进去以后,就能直接在视频中切镜。

我们看看Seedance 1.0 pro的生成效果。

这个语义理解能力有点离谱了,我在Prompt里面写的几乎在这10s里面,全都实现了,最最离谱的是。

我的结尾,写到,镜头最后定格在一块路牌上:WELCOME BACK, KING。

我知道,这个字稍微有点错误,有点乱码,但是不妨碍,它听懂了我的话,这个路牌,是真的给我生成出来了,而且文字,是真的在尝试生成,虽然没有即梦图片3.0那么完美的准确,但是我相信,给字节时间,这都不是问题。

还有一个我很喜欢的猫。

再加上Prompt:

一只橘猫坐在金色地毯上,缓慢睁眼,睫毛微颤,镜头缓慢前推。镜头切换。特写镜头,猫抬爪按下地毯边缘一块砖,地面机关咔哒响起。镜头切换。全景镜头,周围蜡烛同时熄灭,背后石壁缓缓打开,一道亮光射入。

非常完美,文生视频也可以,用了一段之前藏师傅的Prompt:

一系列快速变换的动态镜头:运动员在烈日下奔跑,大汗淋漓,汗珠从额头滴落;冲浪者乘风破浪;一群年轻人在户外音乐节上兴奋地跳跃。特写镜头显示冰镇饮料被打开,气泡升腾。最后,几个人举杯祝酒,脸上洋溢着满足而充满活力的笑容。


二. 运动质量

这次Seedance 1.0 pro的运动质量也在第一梯队。

第一个出场的是大嘤著名硬汉邦德。

提示词非常简单:男人瞄准目标,举枪,开火。

拉栓,举枪,瞄准,射击,一套动作非常行云流水。

开火那一瞬间的后坐力,和映在脸上的火光,也很真实,这部分其实属于物理规律测评的范畴,不过,是优点,就先拎出来夸一夸。

然后是这个非常抽象的,骷髅跳踢踏舞。

虽然只剩骨头架子,但动作幅度还挺大,挺有劲儿,虽然这舞跟我跳的有的一拼。

认认真真看,这哥们儿也比较争气,哪哪儿都没有崩。

还有两哥们一起吃煎饼,如果不知道的,可能还以为是某部复联电影里的。

还有最难的,运动。

提示词:一个男人跑步运球,投篮,镜头跟随男人。

十秒的时间,无论是运球还是跑步,都没有出错,很稳定。

唯一要吐槽的就是,投篮没投进去。不过至少是符合物理规律的,不像有些AI,为了把球投进去,使出了不知道多少邪术,牛顿的棺材板都要压不住了。

然后是踢足球。

提示词:球员脚法熟练地带球过人,动作流畅,运动镜头跟随人物。

带球过人体现不够明显,阻拦的人只是在前景里晃了一下。不过除此之外,运动员的动作很稳。


三. 情绪

这部分最重要的是让大家沉浸式感受,所以我就多放case,少说两句。

一个我很喜欢的镜头,跑着跑着就哭了,感同身受。

女孩看向镜头,微笑。

心事重重的孩子,看着车窗外。

恐惧,瞳孔放大。

女孩流下眼泪。

拳击手被打倒,仍然不屈地站起来。

好奇的小比格犬。

让我印象最深的其实是这个case,我告诉模型,这个宇航员氧气要耗尽了,地球就在眼前,但他回不去。

这是Seedance 1.0 pro给我的两种表演方式:

第一种,很克制,没什么大的表情。嘴角微微一笑,看起来像是回忆起了人生中某一段难忘的经历,又像是因为缺氧而恍惚,就要命不久矣。

第二种,沉浸式体验什么叫喘不上气。大口呼吸,满满的求生欲。镜头一切,窗外,马上就到地球了,就差这么一口气。这可不得急吗,我都替他急。

真的,就看什么AI的表演,能搞个奥斯卡玩玩了。


四. 运镜

其实运镜在前两块也有涉及,不过这块,我们搞得更纯(炫)粹(技)一点。

360度环绕一下。

再环一下。

航拍一下。

再追个车。

这平稳度,感觉已经可以把Seedance 1.0 pro当无人机使了。


五. 物理动态效果

这部分考验的主要是Seedance 1.0 pro能不能压得住牛顿他老人家的棺材板。

这段视频,涉及到马匹奔跑、蒸汽朋克齿轮运转、水花溅起、毛发飘动的要素。

每个要素单拎出来说,都容易出问题。

但是这段视频,除了马背上的鬃毛稍微有些僵硬,我挑不出别的毛病了。

地球上的物理规律太简单了,我们再上点难度,太空物理。

还行,牛顿没什么意见。

水下来一个。

头发和衣服的漂浮、水中泡沫、水底波纹,都很符合真实世界规律。

涂口红,皮肤的张力非常的真实。

骑摩托的效果也很丝滑。

包括延时摄影效果。

爱情片桥段里经常出现的一起捏陶罐,现在也能做了。

而且很搞得是,捏陶罐最重要的不是陶罐,而是肢体接触,这俩人的手,从头到尾就没撒开过。


六. 风格化

即梦的风格化一致性,一直是我觉得做的最好的,没有之一。

这是特定风格下的一致性效果:

男人放下枪,掏出一块面包,吃了起来。

对比前面,邦德那是真硬汉,这个年轻人带了点儿别的情绪,像第一次上战场手足无措的孩子。

就真的,挺细腻的。

还有之前我短视频里做的像素化,只有Seedance 1.0 pro,能很好的roll出来。

动漫风格,双手不断的在水中挣扎。镜头切换,特写,男主恐惧的双眼。

很有风格特点的两个插画风格。


写在最后

以上,相信大家看完,对于Seedance 1.0 pro已经有一个比较清晰的认知了。

可以说,Seedance 1.0 pro这个新晋榜一大哥确实不虚,角色动作、表情和情绪、物理规律、运镜能力、风格一致性、语义理解上没有短板,都处于第一梯队领先水平。

而且在体育运动、表情和情绪处理、风格一致性方面,还经常会给到人惊喜。

感觉,Seedance 1.0 pro要在榜上盘踞一段时间了。

当然,其他友商也不会闲着,都在虎视眈眈。

AI视频,确实越来越卷了。

说白了,卷来卷去,最终被利好到的,还是我们这群用户。

现在,火山引擎也把Seedance 1.0 pro开放给了企业用户。大概每5s的1080P的视频价格是3.67元。

也将于今日在豆包App全量上线,打开豆包App对话框,选择“照片动起来”,输入文字指令或上传图片,就能体验了。

所以,卷点好啊。

其实,还是很感慨的。

作为从runway时代就开始玩AI视频的人,这两年见过很多很棒的AI视频产品,有些名噪一时,却逐渐掉队。

有些不声不响,一直默默追赶。有些出道就惊艳世人,还在勇攀高峰。

希望榜单里,常看到国产模型的名字。

惟愿。

国运昌隆。

(文:数字生命卡兹克)

发表评论

×

下载每时AI手机APP

 

和大家一起交流AI最新资讯!

立即前往