作者|子川
来源|AI先锋官
AI视频圈狼烟再起,腾讯发布混元视频生成模型,发布即开源!
宣布其混元视频模型正式上线,并同时开源了这一视频生成大模型,参数量高达130亿,也是目前最大的视频开源模型之一。

要知道,国产AI视频这条赛道已经够拥挤了,前有可灵、海螺、即梦、Vidu、PixVerse、清影。现在又来了一个实力雄厚的混元视频生成模型。

抛开其他因素,单从视频的画质上来看,就知道混元视频生成模型此次不好惹,它是想要来瓜分蛋糕了。
So小编决定,用网友生成的视频和可灵、即梦来个PK,看看腾讯这波是否货真价实。
AI 视频内容创作圈内有言:运动是视频生成领域皇冠上的明珠,因为它最具挑战性,下面我们来实测一下它们的运动效果。
细看,我们会发现它们在追逐的的过程中,有几帧动作表现得不是很自然,有点崩的感觉。
这是三兄弟运动表现最为稳定的一组了,无论是小猫还是金毛犬的动作都很自然。
好家伙,小猫咪直接来了一个弹射起步,这是在我面前表演尬的啊。
在运动表现这块,即梦的表现要更好一点,这局即梦获胜!
语义理解一直是AI视频模型的老大难问题,也是许多内容创作者最为关心的事情。毕竟,你让它生成A,它偏偏甩给你个B,真会让人火大。
下面就看它们面对又长又复杂的文字描述,能不能把信息吃透然后给个靠谱的输出。
提示词:动画场景特写了一个短毛绒怪物跪在融化的红蜡烛旁边。艺术风格为3D写实,注重光线和纹理。这幅画的氛围充满了惊奇和好奇,怪物睁大眼睛张着嘴巴注视着火焰。它的姿势和表情传达出一种纯真和俏皮的感觉,仿佛它是第一次探索周围的世界。暖色调和戏剧性的光线运用进一步增强了画面的温馨氛围。
可灵这次表现的就非常不错,眼睛睁得大大的,惊奇和好奇的表情也惟妙惟肖,几乎是完美遵从了提示词的语义,不过就是这形象有点不太好看。
小绿毛的表情就略显夸张了,把惊奇理解成惊吓,脸上满满的恐惧感。
不知道是什么原因,提示词几乎没有嘴巴动的描述,但混元中的小黄毛嘴巴一直在说个不停,表情中也没有显露出惊奇和好奇。。。
镜头切换可是AI视频模型比拼的主战场,无论是电影大片还是Vlog日常,镜头切换都已经是家常便饭了。
接下来,就让我们看看这些模型在镜头切换上的“身手”如何!
提示词:一个极端特写镜头,聚焦于一位时髦的美丽女性,她坐在咖啡馆里,深陷沉思,镜头切换到城市的街景,景深效果,电影般的 35 毫米胶片质感,光线非常具有电影感。
想必不用我多说,都知道哪个的镜头切换更为自然了。即梦不愧是出自字节,在镜头切换这块算是玩的明明白白。
整体体验下来,会发现腾讯混元的视频模型在各个方面离国产的老牌AI视频工具还有点距离,但不得不承认,它的起跑线真高,出道就能和老牌的视频模型掰手腕了,而且效果还不赖,属实是天赋异禀了。
最重要的是,它开源了!而且从表现上来看,是目前视频开源领域效果最好的那一个了。
说实话,我已经完全不期待Sora是否能兑现,因为国产的AI视频工具已经具备Sora的水平,而且还不止一个!
(文:AI先锋官)