实测腾讯开源混元视频模型：PK 可灵、即梦，效果不赖

作者｜子川

来源｜AI先锋官

AI视频圈狼烟再起，腾讯发布混元视频生成模型，发布即开源！

就在昨天，腾讯摊牌了，不装了！

宣布其混元视频模型正式上线，并同时开源了这一视频生成大模型，参数量高达130亿，也是目前最大的视频开源模型之一。

要知道，国产AI视频这条赛道已经够拥挤了，前有可灵、海螺、即梦、Vidu、PixVerse、清影。现在又来了一个实力雄厚的混元视频生成模型。

只能说，各位友商，自求多福吧。

话不多说，先给大家看几个腾讯官方发出的宣传视频。

抛开其他因素，单从视频的画质上来看，就知道混元视频生成模型此次不好惹，它是想要来瓜分蛋糕了。

同时腾讯还放出评估结果：

从结果来看，混元视频生成模型整体质量排名第一。

同时该模型已上线腾讯元宝APP，并在逐渐开放中。

不过，小编没被灰度到。

不少网友已经拿到内测资格，并给出了第一手实测。

So小编决定，用网友生成的视频和可灵、即梦来个PK，看看腾讯这波是否货真价实。

运动效果：

AI 视频内容创作圈内有言：运动是视频生成领域皇冠上的明珠，因为它最具挑战性，下面我们来实测一下它们的运动效果。

提示词：一只金毛寻回犬在白雪皑皑的德国追逐一只猫

可灵1.5Pro：

细看，我们会发现它们在追逐的的过程中，有几帧动作表现得不是很自然，有点崩的感觉。

即梦PixelDance：

这是三兄弟运动表现最为稳定的一组了，无论是小猫还是金毛犬的动作都很自然。

腾讯混元：

好家伙，小猫咪直接来了一个弹射起步，这是在我面前表演尬的啊。

在运动表现这块，即梦的表现要更好一点，这局即梦获胜！

语义理解：

语义理解一直是AI视频模型的老大难问题，也是许多内容创作者最为关心的事情。毕竟，你让它生成A，它偏偏甩给你个B，真会让人火大。

下面就看它们面对又长又复杂的文字描述，能不能把信息吃透然后给个靠谱的输出。

提示词：动画场景特写了一个短毛绒怪物跪在融化的红蜡烛旁边。艺术风格为3D写实，注重光线和纹理。这幅画的氛围充满了惊奇和好奇，怪物睁大眼睛张着嘴巴注视着火焰。它的姿势和表情传达出一种纯真和俏皮的感觉，仿佛它是第一次探索周围的世界。暖色调和戏剧性的光线运用进一步增强了画面的温馨氛围。

可灵1.5Pro

可灵这次表现的就非常不错，眼睛睁得大大的，惊奇和好奇的表情也惟妙惟肖，几乎是完美遵从了提示词的语义，不过就是这形象有点不太好看。

即梦PixelDance：

小绿毛的表情就略显夸张了，把惊奇理解成惊吓，脸上满满的恐惧感。

腾讯混元：

不知道是什么原因，提示词几乎没有嘴巴动的描述，但混元中的小黄毛嘴巴一直在说个不停，表情中也没有显露出惊奇和好奇。。。

单从语义理解这块，确实是可灵的表现要更好一些。

镜头切换：

镜头切换可是AI视频模型比拼的主战场，无论是电影大片还是Vlog日常，镜头切换都已经是家常便饭了。

接下来，就让我们看看这些模型在镜头切换上的“身手”如何！

提示词：一个极端特写镜头，聚焦于一位时髦的美丽女性，她坐在咖啡馆里，深陷沉思，镜头切换到城市的街景，景深效果，电影般的 35 毫米胶片质感，光线非常具有电影感。

可灵1.5Pro：

即梦PixelDance：

腾讯混元：

想必不用我多说，都知道哪个的镜头切换更为自然了。即梦不愧是出自字节，在镜头切换这块算是玩的明明白白。

整体体验下来，会发现腾讯混元的视频模型在各个方面离国产的老牌AI视频工具还有点距离，但不得不承认，它的起跑线真高，出道就能和老牌的视频模型掰手腕了，而且效果还不赖，属实是天赋异禀了。

最重要的是，它开源了！而且从表现上来看，是目前视频开源领域效果最好的那一个了。

说实话，我已经完全不期待Sora是否能兑现，因为国产的AI视频工具已经具备Sora的水平，而且还不止一个！

（文：AI先锋官）

一	二	三	四	五	六	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30

发表评论 取消回复

下载每时AI手机APP

发表评论取消回复