AI批量生产口播视频,这个红海赛道是怎么又卷又赚钱的?


作者 | 石濑
编辑 | 张洁

这下AI连素人博主的饭碗都不放过了。


最近,上面这组在X上小范围走红的“博主带货视频”,直接把数字人对口型带到了2.0时代。视频中AI生成的数字人,无论是说话神态还是肢体动作,都和我们平时在社交媒体上刷到的真人博主极为相似,惟妙惟肖,让人真假难辨


这组视频一出来,迅速吸引了AI视频圈知名博主、以及红杉、a16z等顶级风投机构投资人的转发,多条推文浏览量破10万,还被评价为“让AI视频对口型时代结束了”。



如果说过去的AI数字人还只是进行呆板对口型动作的“工具人”,那么这一代的AI数字人已经无限接近真人博主的口播效果了——AI不仅能精准对上说话口型,连表情和肢体动作都能配合脚本台词同步还原。


这些AI生成的博主带货视频,背后用到的模型名叫“Mirage”,是AI视频编辑工具Captions近期推出的一个基础模型。


在官方表述里,Mirage被称为“全球首个专为UGC内容生成而设计的AI模型”,用户只需输入脚本或音频文件,便可定制数字人的相貌、背景、着装和情绪,从而生成具有TikTok等主流短视频平台风格的UGC视频。



实际上Captions这款工具早前就是社交媒体上有一定用户口碑的“网红产品”,一些博主甚至将其誉为“拳打剪映、脚踢PR”的AI剪辑神器。凭借AI生成3D虚拟形象、AI剪辑、AI对口型等功能,Captions在2023年实现快速增长,仅移动端下载量就超过1000万次。


2024年7月,Captions完成6000万美元C轮融资。据第三方数据,其年营收估算高达900万美元。


Growjo数据平台


不仅如此,最近硅谷知名风投机构a16z发布的2025年全球100大AI消费级应用报告中,Captions还被提及为最会赚钱的AI音视频应用之一,属于小众低调但吸金能力拔尖的一类AI应用。



低调但吸金,

Captions做对了什么?


提起短视频制作,相信大多数人都会立刻想到字节旗下的剪映。


从Captions的发展历程来看,可以发现剪映相对“大而全”的产品定位恰恰构成了某些场景下的使用瓶颈,为Captions这类应用提供了增长空间。


Captions在2020年年底正式上线iOS端,主打“为Talking Video而生”。Talking Video也就是所谓的口播视频,在这类视频中博主需要真人出镜录制内容,是目前国内外主流短视频平台上最常见的短视频形式。


从前期脚本策划、到中期拍摄,再到后期制作,Captions针对口播视频制作流程解决了诸多痛点,包括智能字幕生成、AI眼神矫正、虚拟数字人创建和多语言适配等功能。



口播视频虽然制作门槛较低,只需一部手机就能拍摄,但对出镜人的要求却很高。尤其是新手博主,面对镜头时难免会紧张,导致表情不自然,出现卡壳、眼神飘忽、语气词过多等问题。


以AI眼神矫正(AI Eye Contact)为例。在这里,我们丢了一段马斯克全程没有看镜头的对谈视频给Captions,看看它能否“化腐朽为神奇”。


原视频


最终结果可以看到:与原片相比,经过AI眼神矫正后,视频中的马斯克镜头感更强,与屏幕前的观众在眼神沟通上也更自然。



围绕口播视频制作这一核心场景,剪映并非没有推出相应的功能支持。早前,我们梳理过剪映(海外版CapCut)在生成式AI时代的转型和商业化动作。


剪映与抖音构成的“创作-内容”联动体系,是字节跳动平台内容生态的核心引擎之一。近年来,随着生成式AI的兴起,剪映也快速跟进并推出了一系列AI工具,包括脚本转视频、AI剪辑、数字人口播等,这些功能与Captions的核心功能存在高度重合。


极为巧合的是,Captions和剪映在某种程度上都是凭借智能字幕生成功能在创作者群体中打响名声的。


B站UP主“影视飓风”曾在2023年发起过一项名为“UP主们都怎么做字幕”的调研。结果显示,95%的UP主会制作字幕,剪映以绝对优势成为首选字幕工具。



Captions的TikTok官方账号中,最早爆火的视频就是一条介绍智能字幕生成功能的内容。同一时期,Captions官方还推出了智能剪口播、AI眼神矫正等产品功能介绍视频,其中播放量最高的一条也是关于智能字幕生成功能的视频。



对比两者的智能字幕生成功能,一个反直觉的现象是:功能更齐全的工具反而可能在用户体验上处于劣势。


剪映不仅功能入口更深,操作界面也相对复杂。


例如,调用剪映的智能字幕,你需要先进入“文本”菜单,再选择“智能字幕”,经历两次点击才能开启功能。


相比之下,Captions的智能字幕功能被设定为默认必选项,且是视频导入后的前置步骤。



并且Captions的AI语音翻译和字幕生成功能是打通的。你只需要在前置步骤页面中勾选“AI Dubbing”,就能自动生成一个带有新语言配音和字幕的视频。


在Captions的帮助下,我们试着让美国知名主持人吉米·法伦说上了一口正宗的普通话:



这个功能剪映也有,不过是以“视频翻译”的独立入口内置在产品中的。


可以说,Captions的产品设计更接近AI原生应用的逻辑:功能不追求大而全,而是通过减少决策步骤提升效率。


与剪映、CapCut等生态型产品竞争,像Captions这类由初创公司推出的AI工具,其机会往往蕴藏在垂直利基市场的生产效率提升上。曾有音视频赛道头部AI产品增长负责人向“AI新榜”表示,AIGC技术在视频领域的应用路线之一就是切入某一个刚需功能,人群大付费高,ROI(投资回报率)就能打正。


短视频作为主流内容形式的当下,视频在各种内容形式中制作门槛相对较高,任何小的垂直场景和特定功能优化,只要能降低视频制作门槛、帮用户赚到钱——无论是提高生产效率还是革新视频内容创作形式,都有可能吸引用户付费。


就Captions的迭代历程来看,它一直专注于“口播视频”这一垂直领域,延展产品功能板块。


从最初的智能字幕生成,如今拓展到AI数字人、AI生成视频广告、UGC内容生成AI模型Mirage,都在致力于满足口播视频创作者的各种潜在需求,甚至可以说开拓了剪映无法满足的非专业创作群体,如自媒体创业者、跨境小商家、小型MCN机构等。


目前,Captions采取分层订阅模式。虽然所有计划均提供传统视频编辑功能,但涉及生成式AI的功能都需要付费订阅才能使用。其最新上线的“全球首个专为UGC内容生成而设计的AI模型”Mirage,现阶段以前三个月199美元、之后每月799美元的定价开放订阅。


这个定价也算是跟OpenAI学到了精髓,给人一种“先割一波”的感觉。据首批尝鲜用户返评,Mirage模式下虽然生成的数字人更自然、更逼近真人,但每段视频制作时长被限制为4秒,远远达不到口播视频的商用标准。



但不得不说,从“UGC内容生成”切入AI数字人这个定位很“妙”。与网红级别的KOL相比,社交媒体上生产UCG内容的素人博主虽不一定有很高的商业影响力,但能够通过真实的内容吸引特定的受众。


与此同时,素人博主的个人IP风格相对KOL来说不那么强烈,且投放成本相对较低,因而近年来备受品牌青睐。随着AI对口型能力的增强,说不定在不远的未来,AI生成的素人带货博主会成为品牌营销+AI应用的常态。



AI视频剪辑赛道,

为什么又卷又赚钱?


AI视频剪辑赛道上,Captions面对的对手,不仅有实力强劲的剪映,还有一众定位类似的初创企业推出的产品,包括Veed、Zeemo、Clipchamp等。


其中由前搜狗手机输入法技术负责人张冠群创业公司蓝色脉动推出的海外产品Zeemo(国内版为绘影字幕)尤为值得关注。Zeemo切入的方向正是Captions起家的字幕生成领域,但其支持95种以上的语言,相比之下,Captions目前最多支持29种。


凭借多语言转录及翻译这一优势,Zeemo获得了快速增长,移动端总下载量超700万,印度、巴西和巴基斯坦等新兴市场用户增长迅猛。



蓝色脉动针对海外市场推出的另一款产品Vizard,则主打用AI做短视频切片这一细分赛道。AI切片这一功能Captions也有,但并不是其最出圈的功能。早前我们也实测过一批AI切片工具,OpusClip是这个细分领域口碑较好的产品


Captions最大的优势在于将AI技术应用于提升传统口播视频制作效率,国内也有同类替代产品,如美图公司推出的“开拍”,就集成了从脚本构思、高清拍摄、AI眼神矫正、人像精修到智能后期剪辑的一系列功能。



AI视频剪辑赛道的核心需求源于全球短视频创作与传播的爆炸式增长。围绕当下这波短视频生产效率革命,用AI重塑传统视频制作流程,需求很多(且为刚需),但也非常卷。


对Captions们来说,只要能在起步阶段打造出一个出圈功能,就能在当下这波AI浪潮中分到一杯羹。


据a16z最新发布的全球生成式AI应用报告,AI图像/视频类应用在营收表现上十分突出,占全部应用类型总营收的20%。除了Remini、SNOW、Photoroom、Pixelcut、Photoshop Express明确定位为图像编辑工具,其余5款上榜产品都与音视频编辑直接相关。



但面对剪映、Adobe这样的行业巨头,就我们观察来看,大多数初创公司都还没有找到真正的产品壁垒,这也导致市面上的AI视频剪辑工具必须持续迭代相似热门功能,陷入同质化竞争的困境。


从Captions的成功经验来看,市场依然为深耕者留有机会——正如短视频行业早期,一个滤镜或模板就足以成就一款现象级产品。对初创企业而言,与其在通用功能上与巨头硬碰硬,不如聚焦于细分场景,在巨头无暇顾及的缝隙中扎根生长。



(文:AI新榜)

欢迎分享

发表评论