Midjourney V1上线,赛博菩萨想让人人用得起AI视频 实测



作者 | 石濑
编辑 | 张洁


它来了,AI图像领域的绝对王者带着它的首个视频模型来了。


就在今天凌晨,Midjourney正式推出了其首个AI视频生成模型V1,用户可以上传一张图片,或基于Midjourney图像模型生成4段5秒视频。


从官方演示来看,V1在人物运动、画面一致性上表现都相当亮眼,甚至延续了Midjourney在图像领域积累的审美优势,生成的视频注重画面整体美感,而非单纯追求真实感



目前V1仅通过Discord平台提供,并且初期仅支持网页端使用。


体验网址:https://www.midjourney.com/


进入网址后通过谷歌或Discord账号登录即可,这次Midjourney也相当有诚意,视频模型并不需要单独付费,如果你是订阅会员(最低每月10美元)直接上手用就完事了。


视频生成定价上,官方称每秒视频大约是一张图像的成本,比市场之前推出的模型便宜25倍以上,所以他们认为V1的价格打到了一个“人人可用”的程度。未来还会针对专业版和Pro版用户推出无限制视频生成服务,在AI视频生成要数着积分过日子的现在,这计划很“赛博菩萨”了。


下面话不多说,一起来看看:AI生图之王推出的首个视频模型,到底有多强。




Midjourney V1


V1和Midjourney网页端做了深度融合,进入页面后,只需要像往常一样生图或上传图片,点击图片上的“Animate”即可生成视频。也就是说,V1目前仅支持图生视频。

 

虽然初始生成的视频时长只有5秒长,但用户可以选择将视频延长4秒,最多可延长4次,这意味着V1最长可生成21秒视频。


测试一:复杂指令遵循


提示词:一座巨大、正在腐朽的佛像,位于一座黑暗的洞穴寺庙之中,整体采用《黑神话:悟空》的美术风格。佛像的脸上挂着一抹奇异而暧昧的微笑。一束光照亮了它布满青苔和裂纹的脸庞。画面要求超写实、具有戏剧性的光照和令人压抑的氛围。



初始5秒视频生成好后,用户可以选择自动或手动的方式来延长视频。手动模式下,用户可以通过修改提示词,控制镜头运动、新增场景画面等。


此外,用户还可以在设置中选择“Low Motion”或“High Motion”来调整镜头运动和画面主体的运动幅度。



在这里,我们经过多轮手动增加“佛像头上的野花”、“蝴蝶落在野花上”等提示词,让V1一口气生成了一个21秒的视频。



测试二:人物特写


提示词:Joaquin Phoenix饰演的小丑,在一个深夜脱口秀节目上,突然转向镜头,带着巨大而癫狂的笑容直视观众。周围是明亮的演播室灯光,画面要求照片般逼真且充满电影感。



测试三:手部动作


提示词:画面中,演奏者正在弹唱鲁特琴弦。尘埃在戏剧性的光束中飞舞。他脸上的表情充满张力、饱含情感。



这轮测试里,我们上传了卡拉瓦乔名画《鲁特琴演奏者》给V1。最后效果相当惊喜,不仅人物情感表现丰富,而且AI驱动的手部动作也比较自然逼真,在保持较大动作幅度的同时,画面也没有崩坏。


测试四:人物运动


提示词:一位芭蕾舞演员,在一个洒满阳光、尘土飞扬的舞台上,用慢动作完成了一个完美无瑕的单足旋转。镜头采用低角度拍摄。



AI往往难以处理体操、芭蕾等涉及复杂物理定律的动态画面,V1在这轮表现还算不错,整体没有出现特别抽象或离谱的画面。不过,芭蕾舞演员多次转圈时,腿部还是出现了一些奇怪的扭曲。


测试五:超现实


提示词:一幅超现实主义的女性肖像,她的脸是由盛开的牡丹花和破碎的青花瓷片拼接而成的美丽拼贴画,既优雅又混乱,纹理细节丰富,明暗对比强烈,杂志大片风格。



测试六:特定风格表现


吉卜力风格

提示词:以吉卜力工作室的风格,一个头发上扎着红丝带的小女孩,正望着一列轻微摇晃的火车窗外,窗外是连绵的绿色山丘和蓬松的云朵。



70年代华丽摇滚风

提示词:《Vogue》杂志大片风格,一个70年代华丽摇滚风的角色,画着闪粉妆,戴着华丽的羽毛披肩,身穿缎面连体裤,在黑暗舞台的聚光灯下摆出戏剧性姿势,高对比度。



赛博朋克与高级时尚摄影

提示词:一位前卫模特穿着半透明的全息雨衣,几何光影图案投射在她和雨衣上,雨夜站在霓虹闪烁的东京街头,充满情绪和氛围感。



整体来看,V1的表现可以说是“瑕不掩瑜”。作为Midjourney推出的首个视频模型,V1延续了其图像模型的美学表现,在调色、构图、情绪表达等方面表现出色,能够生成具有一定艺术感的视频。


同时,V1生成视频速度很快,且能够实时预览生成画面过程。


明显的缺点是,在一些复杂动作场景中(如芭蕾舞),V1仍然会生成不符合真实物理世界运动的人物运动画面,并且V1目前只支持图生视频,生成的视频默认为480p分辨率,且长宽比会自动适配图像原尺寸。


对此,V1一发布,Midjourney公司也给出了一个说法:他们的目标不是AI视频模型,而是开发能够实现“实时开放世界模拟”的AI模型。V1只是他们迈向终极目标过程中的一个“垫脚石”,未来还会有更多功能上线。


至少对广大AI玩家来说,这次V1的出现提供了一个量大管饱、审美还不错的视频模型选择。


各位玩家觉得V1效果怎么样?欢迎在评论区留言分享你的玩法👀





(文:AI新榜)

发表评论