AI好好用报道
一手实测。
腾讯打了场「闪电战」。
3 月 3 日,腾讯元宝反超 DeepSeek,登顶中国区苹果 AppStore 免费榜榜单第一。
要知道,春节前,腾讯元宝的排名还在 200 名开外,在一众大模型面前就是个「小卡拉米」,但自从接入 DeepSeek 后,仅用了 10 天时间,就一口气杀到榜单第二。
紧接着又用了不到 10 天,坐上了这头把交椅。
腾讯元宝的广告贴得到处都是。
刷个公众号、朋友圈,冷不丁就跳出个「「腾讯元宝,AI 人工智能专家」的字样:
充个话费,微信「生活服务」栏里就赫然躺着个「元宝下载」:
搜索个信息,也能在微信搜索栏下方瞅见它:
听个歌吧,一打开 QQ 音乐,开屏广告就是它;在腾讯视频追个剧,暂停一下还是它;甚至开个会,都逃不过它。
此外,B 站、小红书、微博等各类 APP 中也都有元宝的身影。
腾讯元宝疯狂拉新的同时,混元视频也没闲着。
3 月 6 日,腾讯混元终于上线并开源了图生视频模型。
体验链接:https://video.hunyuan.tencent.com/
只需要上传一张图片,输入提示词,就能生成一段自带配音的 5 秒视频。
视频画质最高可达 2K 高清。

接下来,我们就去体验一下。
-1-
表情控制
表情是人类交流中最直观、最重要的部分。
一个微笑、一个皱眉,甚至一个眼神的微妙变化,都能传递出丰富的情感信息。
如果 AI 生成的视频中人物表情僵硬、不自然,观众会立刻感到疏离,甚至会觉得「一眼假」。
我们就先来试试混元 AI 视频的「表情控制」能力。
前两天,第 97 届奥斯卡金像奖获奖名单出炉,阿德里安・布劳迪凭借电影 《 野兽派 》,拿下最佳男主角。
我们上传了一张他以往的剧照,然后输入提示词:男人悲伤地流泪。
画面中的阿德里安立马鲜活起来。
他的眉头微微皱起,眼中闪烁着泪光,泪水缓缓地从眼眶中溢出,顺着脸颊滑落,头部还微微抖动。
不过可惜的是,混元自动生成的配音对不上。
我们又上传了一张 Midjourney 生成的人物特写照,输入的提示词也很简单:男人微笑起来。
混元生成的视频中,白发老人时而紧盯镜头,时而目光低垂。
微笑时,眼睛眯起,眼角的皱纹更加明显,嘴巴微张上扬,露出几颗牙齿,整个表情逼真自然,同时还伴随着身体的动作,使画面更不显呆板。
-2-
剧情向
如果我们把提示词写得稍微复杂一些,混元还能生成堪比电影大片的剧情向视频。
比如,我们输入提示词:老人坐在长椅上,这时从画面右侧走过来一个年轻女性,看着老人。

混元严格遵循了文本描述。视频一开始,一位老人独自坐在公园的长椅上,背对着镜头,随着老人目光的移动,画面右侧走进一名身穿黑色风衣的年轻女性。
虽然她的运动幅度较大,但并没有出现左右腿不分或者四肢乱飞的畸变问题。
它还发挥想象力,在远处生成了几辆汽车缓缓驶过,让画面更加充实,场景也更加逼真。
我们还截取了《傲慢与偏见》中凯拉・奈特利的一帧画面,提示词:女生坐在秋千上,画面左侧走过来一个男人。

视频中,女主轻轻荡着秋千,男人从左侧入画,顺势移步到女主的身后,整套动作流畅自然,几乎挑不出什么毛病。
不过遗憾的是,女主的面貌发生了改变,已经不是凯拉・奈特利,这也说明混元在主体一致性方面还有进步空间。
再比如下面这则混元生成的视频,无论是对提示词的遵循,还是对运动细节的处理都很到位,但也犯了同样的毛病 —— 人物的面貌会发生变化。
(提示词:女生正走在路上,画面左侧走过来一个男人,手里拿着一捧玫瑰花。)
-3-
制作广告片
去年 AI 视频生成模型集中爆发时,不少网友开始使用 AI 制作广告片。
这次混元的「图生视频」功能上线后,AI 广告制作者又多了一个选择。
比如,我们丢给它一张树莓冰激凌的图片:
为了让生成效果更佳,我们可以使用接入 DeepSeek 的腾讯元宝来写提示词。

由于混元「图生视频」提示词不能超过 200 字,我们可以将其简化一下:
超现实主义美食 CG 动画,4K 分辨率,主体为慢旋转的威化甜筒冰淇淋特写,展示细腻乳脂从顶端缓缓滑落的黏稠质感,5 颗带露珠的覆盆子依次弹跳溅起水花,背景暖橙色渐变光晕中漂浮着动态冰晶粒子,Phantom 高速摄影捕捉水滴飞溅。
上效果:
(配音为混元自动生成)
再来一个香水的广告看看效果:
(提示词:超现实香水广告 CG,中心悬浮的 Art Deco 风格蓝水晶香水瓶缓慢自转,蝶群环绕飞舞。配音为混元自动生成。)
此外,我们还发现,除了图生视频功能外,混元视频还上线了对口型和动作驱动功能。
我们只需一张不带手的头肩半身照,外加一段 10 秒的音频或者是输入希望角色说出的内容即可。
比如女版马斯克唱《红色高跟鞋》:
我们还可以上传图片,选择动作模版,即可一键生成同款动作驱动视频。
比如让哪吒跳广场舞:
(文:AI好好用)