大家好,这里是歸藏(guizang),今天带来新鲜出炉的 Hailuo Video Agent 体验。
前几天我就说随着视频生成模型成本的提高和提示词遵循效果变好,成熟的视频生成 Agent 应该马上就会出现了。
没想到 MiniMax 先做了,他们将会分阶段打造 Hailuo Video Agent。
- 第一个阶段是提供专业视频创意Agent模版,用户上传图片或者打几个字就能一键生成高质量视频
- 第二个阶段将会实现让用户在任意的进度自由的打断和编辑
- 第三个阶段就是端到端的完全自动化 Agent

这个路径是非常务实而正确的,刚好前几天 Andrej Karpathy 也分享了类似的观点,应该先做半自动的钢铁侠战甲组件,最后做完全自主的机器人。
我们应该专注于构建“钢铁侠战甲”(增强工具),而不是“钢铁侠机器人”(完全自主Agent)这些产品应具备自定义 GUI 和用户体验,以加速人类的生成-验证循环,同时仍提供自主性滑块,允许产品随时间变得更加自主。
刚好今天他们开放了第一个阶段的 Agent 使用权限,我试用了一下。
打磨的非常好,选择你喜欢的模板,点“做同款”就行,门槛超级低,基本上传图片完事了,真正的有手就行。
模板覆盖了你能想到的所有AI 视频出圈玩法,不管是外国山海经还是人像动态写真还是产品广告视频,你能想到的品类这里都能找到。

你现在在社交媒体刷到的最多的应该是 AI 写真类的内容,以前大部分都是 AI 图片,ID 保持也不是很好。
Hailuo 直接把这个玩法变成了视频,而且 ID 保持非常好,跟原图也有很顺滑的过渡。
比如这里这个模板,我上传的图片会有个水漫上来的效果,然后变成在水下的礼服,之后会更换多套不同的礼服,面部相似度依然可以保持。
要是你说我不喜欢这套礼服怎么办,没事里面有非常多同类,玩法的模板,直接上传照片,点确定一键生成。

从右侧 Agent 显示的信息可以看到模型会先分析图片信息,之后生成不同图片的提示词,之后生成视频剪辑。

有了人物的动态写真怎么能没有宠物呢,最近短视频平台的 AI 视频品类常青树就是可爱的动物做饭或者其他日常生活,都快发展成 IP 宇宙了,生命力非常旺盛,现在依然在爆火。
Hailuo Video Agent 当然也可以做,而且只需要上传你宠物的照片就行,不需要任何提示词。
这里我整了一个狗狗麦当劳送货的视频,非常可爱,得益于 Hailuo 视频模型的强大示例,基本稳定生成。
然后再来个电商场景吧,产品展示类型的视频应该是最常见的电商视频广告需要的画面,以往需要专门的打光和场地进行拍摄。
现在你只需要上传你的产品照片, Hailuo Video Agent 就可以直接一键搞定,只需要简单描述一下产品的样子就行。
可以看到三个分镜下面化妆品瓶子的文字材质都基本没变,大小有些问题,可以在提示词描述一下就行,连音乐都是卡点配好的。
短视频平台火爆的 AI 视频另一个品类就是科普类视频,一般用 AI 视频给你讲清楚一个概念或者事情。
我这里就让 Hailuo 做了一个抹茶的历史科普视频,这个科普视频有 80 秒,结果他除了音乐动画以外还有口播,选的声音也非常合适,终于摆脱短视频平台的劣质 AI 配音了。
只能说现在可以搞定声音加视频全流程一流模型来做 Agent 的也就是 MiniMax 了。
最近流行的还有像素风格的视频,咱也可以一键生成了,只需要上传一张情侣照片,然后给 Agent 描述一下你们日常的几个场景就行,不需要详细只需要词语。
Agent 会提取图片中你们的装束和样貌去生成对应的图片和视频再剪辑。
最后来个小牛马自嘲吧,最近我们上班压力都很大,所以大家都借 AI 视频或者图片来自嘲,不管是原来的 HelloKitty 胶片还是最近的第一人称 Vlog AI 视频都是这样。
这里我整了一个牛马上班的问答视频,这个 Workflow 非常复杂,涉及到了两个不同语音风格的对话,还有视频上的图片文字包装,其中还有字幕的变化。
其实从上面这个视频就能看到 Agent 可以调用的工具非常多,音乐、语音、音效、图片包装、字幕等。
基本上视频制作需要的工具都已经搞定了。
从这么多模板来看 Hailuo 肯定是有一个 Agent 编辑工具的,不然不可能积累这么多,希望他们早日能把这个编辑工具的界面放出来,我都不敢想到时候能有多少流行玩法从这里出现。
我昨天看了 Karpathy 的分享之后发了个朋友圈,不可编辑和暂停修改的 Agent 不可进化,从 Minimax 发布的三个阶段来看他们是真的懂,希望尽快看到第二个阶段的 Hailuo Video Agent。
好了,到这里教程基本就结束了,谢谢各位的双击🩷和大大的赞👍,孩子饿坏了,给点吧。
(文:归藏的AI工具箱)