腾讯混元上线图生视频模型,我们用7个Prompt测试了下

 AI好好用报道

编辑:杨文
一手实测。

腾讯打了场「闪电战」。

3 月 3 日,腾讯元宝反超 DeepSeek,登顶中国区苹果 AppStore 免费榜榜单第一。

要知道,春节前,腾讯元宝的排名还在 200 名开外,在一众大模型面前就是个「小卡拉米」,但自从接入 DeepSeek 后,仅用了 10 天时间,就一口气杀到榜单第二。

紧接着又用了不到 10 天,坐上了这头把交椅。

腾讯元宝的广告贴得到处都是。

刷个公众号、朋友圈,冷不丁就跳出个「「腾讯元宝,AI 人工智能专家」的字样:

充个话费,微信「生活服务」栏里就赫然躺着个「元宝下载」:

搜索个信息,也能在微信搜索栏下方瞅见它:

听个歌吧,一打开 QQ 音乐,开屏广告就是它;在腾讯视频追个剧,暂停一下还是它;甚至开个会,都逃不过它。

此外,B 站、小红书、微博等各类 APP 中也都有元宝的身影。

腾讯元宝疯狂拉新的同时,混元视频也没闲着。

3 月 6 日,腾讯混元终于上线并开源了图生视频模型。

体验链接:https://video.hunyuan.tencent.com/

只需要上传一张图片,输入提示词,就能生成一段自带配音的 5 秒视频。

视频画质最高可达 2K 高清。

接下来,我们就去体验一下。

-1-

表情控制

表情是人类交流中最直观、最重要的部分。

一个微笑、一个皱眉,甚至一个眼神的微妙变化,都能传递出丰富的情感信息。

如果 AI 生成的视频中人物表情僵硬、不自然,观众会立刻感到疏离,甚至会觉得「一眼假」。

我们就先来试试混元 AI 视频的「表情控制」能力。

前两天,第 97 届奥斯卡金像奖获奖名单出炉,阿德里安・布劳迪凭借电影 《 野兽派 》,拿下最佳男主角。

我们上传了一张他以往的剧照,然后输入提示词:男人悲伤地流泪。

画面中的阿德里安立马鲜活起来。

他的眉头微微皱起,眼中闪烁着泪光,泪水缓缓地从眼眶中溢出,顺着脸颊滑落,头部还微微抖动。

不过可惜的是,混元自动生成的配音对不上。

我们又上传了一张 Midjourney 生成的人物特写照,输入的提示词也很简单:男人微笑起来。

混元生成的视频中,白发老人时而紧盯镜头,时而目光低垂。

微笑时,眼睛眯起,眼角的皱纹更加明显,嘴巴微张上扬,露出几颗牙齿,整个表情逼真自然,同时还伴随着身体的动作,使画面更不显呆板。


-2-

剧情向

如果我们把提示词写得稍微复杂一些,混元还能生成堪比电影大片的剧情向视频。

比如,我们输入提示词:老人坐在长椅上,这时从画面右侧走过来一个年轻女性,看着老人。

混元严格遵循了文本描述。视频一开始,一位老人独自坐在公园的长椅上,背对着镜头,随着老人目光的移动,画面右侧走进一名身穿黑色风衣的年轻女性。

虽然她的运动幅度较大,但并没有出现左右腿不分或者四肢乱飞的畸变问题。

它还发挥想象力,在远处生成了几辆汽车缓缓驶过,让画面更加充实,场景也更加逼真。

我们还截取了《傲慢与偏见》中凯拉・奈特利的一帧画面,提示词:女生坐在秋千上,画面左侧走过来一个男人。

视频中,女主轻轻荡着秋千,男人从左侧入画,顺势移步到女主的身后,整套动作流畅自然,几乎挑不出什么毛病。

不过遗憾的是,女主的面貌发生了改变,已经不是凯拉・奈特利,这也说明混元在主体一致性方面还有进步空间。

再比如下面这则混元生成的视频,无论是对提示词的遵循,还是对运动细节的处理都很到位,但也犯了同样的毛病 —— 人物的面貌会发生变化。

(提示词:女生正走在路上,画面左侧走过来一个男人,手里拿着一捧玫瑰花。)


-3-

制作广告片

去年 AI 视频生成模型集中爆发时,不少网友开始使用 AI 制作广告片。

这次混元的「图生视频」功能上线后,AI 广告制作者又多了一个选择。

比如,我们丢给它一张树莓冰激凌的图片:

为了让生成效果更佳,我们可以使用接入 DeepSeek 的腾讯元宝来写提示词。

由于混元「图生视频」提示词不能超过 200 字,我们可以将其简化一下:

超现实主义美食 CG 动画,4K 分辨率,主体为慢旋转的威化甜筒冰淇淋特写,展示细腻乳脂从顶端缓缓滑落的黏稠质感,5 颗带露珠的覆盆子依次弹跳溅起水花,背景暖橙色渐变光晕中漂浮着动态冰晶粒子,Phantom 高速摄影捕捉水滴飞溅。

上效果:

(配音为混元自动生成)

再来一个香水的广告看看效果:

(提示词:超现实香水广告 CG,中心悬浮的 Art Deco 风格蓝水晶香水瓶缓慢自转,蝶群环绕飞舞。配音为混元自动生成。)

此外,我们还发现,除了图生视频功能外,混元视频还上线了对口型和动作驱动功能。

我们只需一张不带手的头肩半身照,外加一段 10 秒的音频或者是输入希望角色说出的内容即可。

比如女版马斯克唱《红色高跟鞋》:

我们还可以上传图片,选择动作模版,即可一键生成同款动作驱动视频。

比如让哪吒跳广场舞:

(文:AI好好用)

欢迎分享

发表评论