凭什么?海螺AI登顶全球第一


海螺AI,拿下第一


最近,a16z发布了2025年全球Top50 AI应用榜单(Web端)


海螺AI(hailuo)凭借用户活跃度、技术社区评分和指令遵循三项指标第一,以全球第12名强势登顶AI视频赛道,超越快手的可灵(第17名)和OpenAI的Sora(第23名)


为进一步聚焦主线,简化品牌认知。近日,MiniMax的产品线也进行品牌名调整(具体见我们这篇文章),原「海螺AI」Chat助手更名为「MiniMax(与01系列开源模型打配合),而海螺的品牌名和域名hailuoai.com则留给了AI视频。


今后,海螺AI专指AI视频。

国内版:https://hailuoai.com/video

国际版:https://hailuoai.video


海螺AI是什么?


海螺AI是MiniMax研发的AI视频生成工具,支持文生视频、图生视频和主题参考生视频。目前,上线了I2V、T2V、S2V系列共6款模型。


6款模型各有不同,简单说就是:


  • I2V,即Text-to-video,图生视频,是专业创作者的首选工具。

  • T2V,即Text-to-video,文生视频,常被创作大佬戏为“玩具”。

  • S2V,即Subject-to-video,参考生视频,是保持一致性的关键武器。

  • Director,即导演模式,特别擅长运镜,大佬都爱玩。

  • I2V-01-live,可以让静图动起来,擅长做二次元视频。


海螺AI自上线(2024年9月)以来,连续6个月在AI产品榜(web)的视频生成全球榜中位居第一,有着自己的“鲜明特点”。


  • 1)海外火爆。比如1月,其国际版访问量达到了1635万,是国内(258万)的6倍。海外大批专业人士(如电影导演、制片人、数字艺术家、游戏开发者、KOL等)成为hailuo拥趸,用户遍布全球180多个地区。

Case by x用户

  • 2)技术过硬。VBench评测中,海螺AI在“人物表情一致性”(89.7分)、“运动连贯性”(91.2分)等维度,均超越了Sora(85.2分)


  • 3)门槛低。无论是使用界面、提示词指令还是运镜,使用门槛都很低,小白也能拍出好莱坞大片。价格也很亲民,5s视频不到0.5元,低于可灵(0.69元)、谷歌Veo 2(2.5美元)、Sora(0.4美元)和Runway(12元)


  • 4)基模优秀。以01系列架构的基础模型,在上下文处理和语义理解上位于国际顶尖水平,使得其视频模型指令遵循非常强,最长可支持200k tokens的输入,中文提示词生成准确率非常高。



海螺AI有哪些功能?


海螺AI提供网页版和APP,其核心功能如下:


3.1 顶级运镜


海螺AI文生视频(T2V)和图生视频(I2V),均提供了Director(导演)运镜模式。


用户只需要输入自然语言或插入相机运动按钮,即可调用各种运镜。


可自由组合的运镜累计有15种,可帮助用户实现多种摄像机运动方式——不同方向的推、拉、摇、移以及晃动、跟随、固定镜头等特殊效果。


海螺AI也支持多运镜组合,预设了左(右)环移、左(右)跟移、左(右)聚焦、上扬、降摇以及场景镜头等多种经典镜头,用户可根据需要快速调用。


如【左摇】+【下降】的组合,广阔的城市景观后,缓缓出现红色跑车的视觉主体。运镜交代主体和背景环境的关系,打开叙事空间。


【晃动】和【跟随】运镜的重叠使用,则传达出灾难现场的混乱感。


镜头【左移】,同时【上摇】,从一只小兔子抬头向左开始,慢慢移向天空,气球顺着小兔子的视线飘向天空。


一位骑士站在废墟中央,手握断剑,仰望远处燃烧的天空。镜头从地面缓缓升起,展现出他周围的荒凉景象。然后镜头【后拉】,逐渐暴露出摇摇欲坠的城墙和远处能能燃烧的地狱。最后,镜头向【上摇】,对准天空中漂浮着的一个怪物的巨大阴影。


运镜控制注意事项:

[左摇]表示:单一镜头生效。[左摇,右移]表示:两个镜头运动同时生效;xxx[左摇],xxx[右移]表示:先发生左摇镜头,后发生右移镜头。注意事项:尽量在期望运镜生效的描述处插入镜头控制词,避免如下的不明确的运镜生效描述:写实风格[跟随,上摇],暖色调,一只鸟在飞翔。


3.2 主体参考


在AI视频领域,如何保持主体一致性,一直是困扰业界的技术难题。


2025年1月,海螺AI带着S2V-01模型来了。用户只需要上传一张带有面部信息的照片,然后输入提示词,就可以生成对应主体的视频。


不同于其他家需要上传多段、多机位视频做LoRA训练,海螺AI只需要上传一张图片就可以了,大大降低了输入和计算成本。


主体基本要求:

面部数量:主体一致功仅支持上传单人照片进行面部识别;图片尺寸:分辨率不低于120*120,图片不大于20M;主体角度:主体需正对镜头或轻微侧对镜头。五官清晰出现在画面内,能够提供最完整的面部信息。其他:面部不可被遮挡,照片不可虚焦或有过多滤镜特效。

比如,这是一张主体图片(略微侧面)


输入提示词:阴天,在石板铺就的古朴小巷里,模特穿着一件棕色灯芯绒夹克,搭配米色裤子和短靴,头戴一顶复古贝雷帽。镜头从模特身后的肩膀开始,跟随他的脚步,捕捉模特晃动的身姿。随后,镜头从模特身旁侧向前移,展现他微笑着用手拢了拢贝雷帽的自然动作。接着,镜头稍微俯拍,捕捉模特站在转角扶墙的优雅姿态,最后以上升的镜头结束,模特对着镜头微笑。视频光色自然,画面具有电影质感。


这是海螺生成的视频。


再看一个Case,这是一张正面视角的主体图片。


输入提示词:一个牛仔骑着马,穿过一片雪景,身后绑着一支步枪。他戴着宽边帽,他粗犷而醒目的五官格外显眼。在他身后的远处,是高大的云杉林,林外是令人叹为观止的白雪皑皑的群山,地面上覆盖着洁白的积雪,牛仔缓缓在寒冷的旷野中骑马前行。他盯着前方,显得坚毅且勇敢。


这是海螺生成的视频。


可以看到,无论何种场景,S2V-01模型都能够准确识别照片中主体的性别、年龄、肤色、五官结构等面部特征,然后生成稳定、连贯的视频,每一帧都与角色一致。


这个功能,在海外可算是被创作者玩坏了。


主体参考+Prompt:A close-up of a young boy in a dimly lit room, his eyes fixed on the glowing screen of a gaming console. The camera is positioned slightly above eye level, focusing on his concentrated expression as his fingers nimbly manipulate the controller. A game character appears, breaking free from the screen’s confines.


作者@Digital da Vincis 创新性地将3D动画/制图与海螺AI主体参考功能进行结合,用于AI大电影制作测试。


创作者@cybertechjordan 将屏幕前的男孩送到了林中的列车上,上演“列车惊魂”一幕。


3.3 神笔马良


在海螺AI的图生视频里,还有一个模型叫I2V-01-Live


它可以让一张静态的二维图像“活”起来,就像神笔马良一样,可以让画里的人物微笑、眨眼或者挥手。无论是卡通、漫画还是手绘风格,都能被赋予生动的动态效果。


这个模型特别擅长二次元创作,比如广告、动画、教育、游戏等场景的视频制作。


一句指令,让手稿里的欧巴活过来。


让相框里的一对爱人深情相拥。


3.4 强大的文生&图生


文生视频、图生视频,则一直是海螺的基本盘,经过多版本迭代,已越来越稳。


01系列(I2V-01、T2V-01),也是一举奠定了海螺的江湖地位。


如今,海螺的视频质量早已迈入电影级。在x上,有很多网友分享通过hailuo生成的视频。比如@WuxiaRocks、@KusanagiMo67070 等。


如果不是作者自己标注来自hailuo,很多人都难以相信这是AI生成的。


海螺AI使用技巧


使用海螺AI,除了我们要对其足够了解(本文第2、3部分)以外,更关键的是要——学会写视频提示词


提示词Prompt是一把由你的灵感与创意构筑的钥匙,是我们打开通往AI奇幻世界的大门。


如果你是初学者,建议先从Prompt基础公式学起。


4.1 Prompt基础版


基础版,主打的就是让AI自主发挥,不对Prompt做过多限制,以求从AI那里吸取灵感和想象力。


Prompt基础公式=要创建的主要表现物+场景空间+运动/变化。


  • 要创建的主要表现物:主要表现物是视频的核心信息,可以是人物、动物、其它物体亦或是不存在的想象之物。

  • 场景空间:场景空间描述的是视频表现物的周围环境信息,可以是精确的标志性空间,如图书馆、咖啡厅,也可以是幻想性的虚构场景。

  • 运动/变化:运动和变化是对于主要表现物在视频中的状态描述,比如物体的静止、运动,环境空间的转化等等。


例如:

  • 一只小狗在公园中奔跑

  • 一个女人打着伞在雨中的街头行走

  • 山谷中的一条小溪静静流淌


4.2 Prompt进阶版


如果你有一定的AI视频制作基础,你可以试着对视频画面或镜头运动进行明确限制,比如运镜、光影、空间、氛围感等,以准确细致的Prompt生成更加准确、更具美感的视频画面。


Prompt精确公式=要创建的主要表现物 + 场景空间 + 运动 /变化 + 镜头运动 + 美感氛围。


  • 镜头运动:镜头运动可以控制视频画面的呈现方式,常见镜头运动有推、拉、摇、移、升、降等。

  • 美感氛围感:可以对画面呈现的视觉风格、画面氛围感进行限定,以得到更加符合预期的表现效果。


例如:

  • 一对情侣坐在公园的长椅上交流镜头维持固定拍摄情侣,画面色调偏暖,氛围温馨。

  • 一只小羊在一片草地里低头吃草镜头缓缓推进小羊,画面色调自然写实。

  • 一个身穿西装的男人面色凝重地在面馆里吃面镜头逐渐拉远展示面馆的吵闹环境画面色调自然。


关于精准的画面控制和表现,这里有两个技巧。


4.2.1 准确描述镜头运动


海螺AI能够响应各种类型的镜头运动,但前提是我们要对镜头运动描述清楚、准确。有3个小技巧可以帮助我们。


  • (1)为镜头运动增加更精确的时序。


比如“镜头旋转下降”,可以优化为“镜头先缓缓下降,之后在下降的过程中向右环绕。”


  • (2)为镜头运动带来的画面变化增加更细致的描述。


例如“镜头从下往上拍摄长颈鹿”,可以优化为“镜头由长颈鹿的脚部特写开始,缓缓上升,拍摄到长颈鹿的身体,最后停留在长颈鹿的面部,近景展示长颈鹿的面部表情。”


  • (3)将镜头运动的时长控制在5-6秒之内,避免过度复杂的镜头导致生成失败。


4.2.2 准确描述画面美学


海螺AI可以识别Prompt中的美感和氛围感描述,并生成相应的精美画面和动态设计。


这里,我们举几个示例,来展示【美感氛围描述】对生成指令的提升效果。


初始提示词:摩托车在都市中飞驰,警车紧追不舍。


优化后提示词:现代都市,镜头首先跟拍一辆摩托车在楼宇间飞速穿梭,然后快速右摇,拍摄它后面急速追赶的警车,繁华的街道、车流和灯光成为模糊的背景。


最终版提示词:现代都市的街道上,镜头首先跟随一辆摩托车在摩天大楼间飞速穿梭。车轮在湿漉漉的地面上留下深深的印迹,周围的建筑物在不断移动的风中摇曳。镜头快速右摇,捕捉到一辆警车紧随其后警灯闪烁,将街道上的霓虹灯和车流映照成绚丽的色彩。繁华的城市景象在背景中模糊成一片流动的光影,摩托车和警车的动作显得异常急促和紧张。


是不是觉得,高级感一下子就上来了?


海螺AI也可以将镜头与美学进行组合使用,生成更高质量的视频。


初始提示词:镜头穿过玻璃,聚焦窗内一位沉思的女士。


优化后提示词:镜头透过一扇透明玻璃拍摄一座现代的玻璃外观高楼,楼体在阳光下闪烁着反射光。镜头之后贴近一扇窗户,窗户玻璃上的反射展现出外面繁华的城市景象。镜头缓缓后拉,通过玻璃,最终聚焦到窗内一位身穿西装的女性。她坐在一个装饰简约的办公室里,专注地盯着电脑屏幕。她的面容在柔和的光线下显得沉思而内敛,与窗外的喧器形成了鲜明的对比。办公室内的装饰简洁而现代,突显了她的专注和内敛。


以上是文生视频的Prompt技巧。图生视频,则要简单许多,主要是基于首帧图片来进行画面描述。


4.3 图生视频Prompt


图生视频Prompt基础公式=首帧中的主要表现物+运动/变化。


  • 首帧中的主要表现物:即画面中的物品,包括主要信息和环境信息,海螺AI能够精确识别图像中的人物、物品等画面信息,并根据Prompt需求进行视频生成。

  • 运动 /变化:运动和变化是对于主要表现物在视频中的状态描述,例如物体的静止、运动,环境空间的转化等等。


这是一张提前做好了的图片。


输入提示词:画面中的蓝色毛绒生物不断搅动着面前的汤锅,汤锅冒着热气,之后蓝色怪物对着面前的锅吹起,面前的汤碗结成冰块。


这样,就得到了一个充满魔幻感的视频。


如果想进一步精确运动和画面,也可以参考文生视频的Prompt精确公式进行设计。


图生视频Prompt精确公式=首帧中的主要表现物+运动/变化+镜头运动+美感氛围变化。


以上Prompt技巧,重点参考了海螺AI知识库


这里,也特别给大家安利下海螺AI知识库。海螺AI每次新功能的更新、使用教程和用户案例,他们的产品团队都会配备一份详细且全面的教程,几乎是我见过写得最仔细的用户手册了。


海螺AI知识库:

https://vrfi1sk8a0.feishu.cn/wiki/DdeBwaDMAiW6fpkdkuTcVn8nnDb


如果要再进一步,进入专业级领域,批量出图、跑视频。这时候,我们得用到智能体Agent了,通过Agent来设计脚本和视频提示词。


具体,参考我之前写的文章《有了这个视频提示词生成器,再也不用手搓Prompt了》。


写在最后


从2024年9月至今,仅仅半年。海螺AI不仅在国内大受欢迎,更是在海外大受追捧。


国内版:https://hailuoai.com/video

国际版:https://hailuoai.video


大量海外用户在社交媒体上大方展示对hailuo的喜爱。比如1.1亿粉丝的YouTuber-PewDiePie,亲自发布视频《The Chinese AI situation is crazy》给海螺站台。


@KarolineGeorges 在X上分享视频Evolving creatures,播放量11万。


@ozan_sihay 上周刚发的视频,播放量很快就破万。


在x上搜索hailuo,你能找到许多创作大佬制作的高质量视频,大家自发为海螺站台、推广。不分国别,只认产品。


不得不说,海螺AI又被MiniMax做成了一款国际化的顶流AI产品,不畏豪强,敢于硬刚。而且还刚赢了,一举登上AI视频的王座。


但是,你看他们自身对这个似乎不屑一顾。而是诚诚恳恳,继续搞技术,做产品,始终保持着自己专注且清晰的判断。这一点,我是打心底很佩服的。


以技术为创作基础,拨动海螺的魔法齿轮,打开艺术的平行宇宙。”或许,我们正在见证神奇的海螺时刻。


Everything, everywhere, all at once.



(文:沃垠AI)

欢迎分享

发表评论