它的AI视频「清影」突然升级到了2.0,图生和文生均升级到2.0版本。
体验路径:
网页端:https://chatglm.cn/video
APP:智谱清言-智能体-清影AI视频
官方介绍:这是一次基础模型的升级,模型结构、训练方法和数据工程都进行了全面升级,画面稳定性和整体质量有大幅提升。
测,必须测,而且还得开着会员测。看看实际跑的case如何。
求求大家帮我点赞+在看回血了,感谢感谢~
于是,我拉着好基友@Pp 接连跑了50多个case。
本次测试,重点是测图生视频。毕竟——文生视频是玩具,图生视频才是工具。
我和好基友@Pp 累计跑了有50来个case(囿于篇幅,文章只展示部分)。
重点从语义遵循、一致性、表演细节(表情/动作/光影/写实镜头)、运镜、美感以及画面稳定性等角度进行测试,以下是一些展示Case。
可以看到,在同一图片、提示词的前提下,清影2.0能生成动作幅度更大的表演,画质明显提升。
4)女人盯着镜头,镜头慢慢拉远,钢铁侠走过来和女人交谈。
6)家人团聚的温馨镜头,白发老人接过女人手中的红色盒子,开心的表情。
7)花朵和藤蔓以极快的速度从大理石雕像的缝隙中生长出来,迅速覆盖脸部和上半身。花朵猛烈地绽放,迫使花瓣和叶子向外推出,裂缝遍布表面,创造出石头与自然的超现实融合。
9)三头牛开着卡丁车穿过风景如画的法国城市的街道。场景高度逼真,生动的日光投射出戏剧性的阴影。奶牛们穿着色彩缤纷的卡丁车连身裤,戴着时尚的太阳镜,一边笑着一边吐着舌头,在路上飞驰。卡丁车在弹跳,稍微失去平衡,打滑时车轮上火花飞溅。
10)激烈、高能的武术场景,两个男人正在打斗,中心人物在半空中,直接向另一个人踢出一脚,脸上流露出强烈的决心和专注。视角是动态的,有角色衣服的特写,包括激烈运动产生的褶皱和纹理。
11)炫酷的车辆广告场景,一辆白色的SUV在一个空间里展示,背景是旋转的巨大钟表表盘。
13)有趣的卡通场景,拟人化薯条、汉堡和炸玉米饼,在明亮的卡通风格背景下欢快跳跃,滴落的的油滴,滴在他们身上。
14)背景是黑色的,流动着银色的液体。该场景的特写镜头是银色金属像液体一样在抽象结构上流动。
15)航拍镜头,丁达尔光,阳光穿过云层照在大地上。
16)镜头慢慢拉远,剧院里,一个穿着红色西装的男人,站在黑色西装乐队中间,正在指挥着一首交响乐,肢体语言丰富,超广角。
17)一只金属绿色的甲虫在沾满晨露的草叶上慢慢爬行,微小的水滴在清晨的阳光下像钻石一样闪闪发光。背景显示出一片模糊的森林,带有柔和的绿色和棕色色调。
19)指尖动物,一只幼小的金钱豹趴在指头上面,张开大嘴,环顾四周。
20)微距镜头,一名用水做的芭蕾舞女孩,在水面上优雅的跳舞,地面上游泳的金鱼。
21)可爱的十二生肖小蛇,蛇年,卡通小蛇戴着舞狮帽,手里拿着一个红包,旁边放着一个装满金币的红色袋子,开心地笑着,背景是绽放的烟花和掉落的金币。
22)地上燃放的烟花组成数字2025,背景的天空绽放的烟花。
从跑的Case来看,清影2.0的图生确实有明显提升。官方称大幅提升38%,名副其实。
所有case,我们做了一个混剪,请看VCR:
Ps.清影还支持“冒金币”特效,春节在“相亲相爱一家人”群整活,就靠它了。
上传一张照片,然后勾选“新年冒金币”特效就可以了,就可以得到这样的撒币视频。
2024年7月,作为国内仅有的几家AI视频玩家,一上线就推出图生和文生功能。不搞内侧,不搞预约,发布即上线。而且走了和其他家不一样的路线——不限制生成次数,提供加速服务。
11月,图生视频升级(4K、60帧、10s),首次推出史上首个CogSound音效模型,让AI视频正式迈入“有声时代”。而且,一举开源了他们家当时的最新模型CogVideoX V1.5,这个模型也是迄今海外用户玩得最多的开源模型之一。
体验地址:https://chatglm.cn/video
从实测来看,图生的提升最为明显。从指令遵循、表演细腻度、画面稳定性、运镜到画面美学、创意想象力,都得到了大幅提升。
这是一次基础模型的升级,升级后的清影2.0版图生视频,绝对有实力进入T1级别。
而且关键是,他们家生成次数无限制,年卡比别家的月卡还便宜。所以,我毫不犹豫就冲了张年卡,支持一下“白宫严选”产品。
清影2.0能力大幅提升,作为创作者抽卡平替,性价比爆表。
(文:沃垠AI)