13天涨粉22万!全美爆火的“宝宝播客”,靠什么拿下2亿美金估值?

全世界的明星都有了“宝宝播客”,我的X、TikTok被刷屏了!



这些爆款视频中,“AI宝宝”不仅样貌与名人神似,表情、嘴型和动作也都非常生动,充满表现力。视频动辄千万播放、百万点赞,相关账号如“babypodcast”13天涨粉超22万。


其幕后推手——Hedra也美美宣布完成由a16z领投的3200万美元A轮融资,估值高达2亿美元。


Hedra因AI对口型工具而出名,以“角色可控”和强调细腻的表现力,打败了一众视频工具。与此同时,它也是一个集成外部模型的“全模态”平台,以“复杂流程模块化”的思路,解决生成式AI工具过于零散的痛点。


今天,我们将拆解这种“宝宝播客”的爆红密码,并探究背后工具Hedra的魔力。


/ 01 /

“可爱”又一次赢了,

拆解Hedra的“全模态”制作平台


“宝宝播客”的核心配方是以“名人萌化+成人叙事”制造猎奇效应,形成独特的传播裂变因子。


国外的喜剧表演通常神态夸张、内容辛辣,这与表情娇憨、不谙世事的婴儿形象形成了强烈的反差。


这类内容深谙“借势传播”,制作门槛也很低。


创作者直接截取现有的爆款内容,例如TheoVon等喜剧演员的经典台词、《1000-Lb.Sisters》真人秀的争议片段,利用原内容自带的粉丝基础和话题度,让“AI宝宝”二次演绎。


▲喜剧人JonLajoi制作的婴儿采访狗播客成爆款视频


这类视频的制作手法非常简单,全程可在Hedra Studio上完成。这个平台以Hedra自研的Character-3模型为核心,生成与编辑一体化,三步可结束战斗:


GPT分析名人特征,生图模型制作其宝宝形象


GPT反推名人特征提示词,即梦、Midjourney等图片模型生成对应的婴儿形象。还需预留面部动态空间,比如张开的嘴巴、自然的表情,为后续口型同步做准备。


举例:photo realistic elonmuskasa baby in a teslat-shirt sitting in front of apodcastmic,elonmusk face(埃隆·马斯克婴儿形象,穿着特斯拉T恤,坐在播客麦克风前,埃隆·马斯克的脸部特征)



②给“AI宝宝”配音,音源可生成或截取


声音可以截取热门播客或影视片段的原声;而定制化内容靠ElevenLabs、MinimaxSpeech02等语音模型生成,可选择沙哑、戏谑或夸张的音色以强化喜剧效果。


③让“AI宝宝”“说话”


将图像与音频上传至Hedra 后,Character-3模型开始发挥作用:它会先分析婴儿面部的关键点(如嘴角、眼球、眉毛),再根据音频的音高、节奏和语义情感生成对应的微表情。


▲“AI宝宝”歇斯底里的表情,还原了《Top Gear主持人的风格


Hedra不仅仅是将人物的嘴巴与语音匹配,还能让表情和姿态与语音内容高度一致。


比如,当音频中出现笑声时,AI会同步触发“宝宝”眯眼、嘴角上扬的动作。其音画同步的精度可达毫秒级,甚至能模拟吞咽、眨眼等细节,让静态图像产生近乎真人的生动感。


事实上,在“宝宝播客”病毒传播之前,Hedra就因制作吉卜力风格的播客视频小火过一次。



两次爆火反应了一个内容趋势——成人对可爱风格(包括动画美学、可爱文化、简化视觉语言)的接受度很高。


剑桥大学实验数据,人类大脑处理卡通形象的情感反应速度比真人快0.3秒。AI营销可用婴儿/吉卜力等低威胁性形象承载复杂的信息内容。


Hedra成立于2021年,自2024年推出Character-3模型以来,迅速积累300万用户并筹集了资金:


  • 2024年8月完成1000万美元种子轮投资

  • 2024年11月完成由a16z领投的3200万美元A轮融资

  • 今年3月获得亚马逊Alexa基金的投资


公司目前估值达2亿美元,累计融资4400万美元,核心用户群为专业创作者和营销人员。目前团队规模仅20人,预计将迅速扩张至三倍规模。


/ 02 /

2年融资4400万美元,

可控性是破局关键


“宝宝播客”AI技术对内容生产范式的一次试探。


Hedra价值不仅在于娱乐层面的流量变现,Hedra透露,其未来计划重点拓展企业营销领域的应用场景。


今年6月,Hedra在其科技周活动上积极与创作者互动,并展示其在企业服务等方面的可能性。当Hedra Character-3模型的动态生成能力可与数字人技术结合,或将大幅降低企业客服、虚拟偶像影视配角的制作成本。


放眼整个生成式AI领域,竞争不可谓不惨烈——Captions、HeyGen、Synthesia和Runway等热门公司都在围绕视频和虚拟形象构建技术。


众多工具卷4k、卷画面精美度,生成的内容仍然时常出现“恐怖谷”——动作僵硬、表情空洞,缺乏人类细腻的情感层次。


Hedra做了两步,来打破这种“恐怖谷”。


首先,Hedra是可控的


通过GPT解析名人特征→生图模型生成婴儿版IP→动态绑定表演风格,Hedra将原本“不可控的艺术表现”转化为“可量产的精准情感触达”,实现IP的低成本萌化再造。


第二,Hedra测重于人物的表现力


其“面部选择”和精确的唇形同步控制等功能,无不体现团队对时间、情绪协调和差异化角色表达的敏感度。


Hedra创始人Michael Lingelbach本人曾是舞台剧演员,他对于人物的动态演绎有着很深的理解。


通过可控和表现力,Hedra面向营销市场完成了对品牌的适配。


另外,零散的生态是生成式AI工具的一大痛点。


例如,HeyGen最长能制作30分钟的视频,但多角色协同生成仍是短板。少数支持双角色生成的工具如TalkingAvatar AI,仍需搭配Notebook LM使用,流程繁琐且兼容性有限。


Hedra平台集成外部模型,具备“文本输入-图像生成-语音合成-多角色动画-智能剪辑”的全流程能力,能根据用户设定的风格自动匹配技术参数。


今年6月,Hedra更新了“人脸选择”功能,允许用户在多角色场景中选择角色的脸部“开口说话”,补上了多角色生成的短板。


正如Hedra创始人谈道:“未来的创作者不应是工具操作者,而应专注于创意本身。技术需要成为隐形的基建,而非显性的门槛。”



文/朗朗


PS:如果你对AI大模型领域有独特的看法,欢迎扫码加入我们的大模型交流群。



(文:乌鸦智能说)

发表评论

×

下载每时AI手机APP

 

和大家一起交流AI最新资讯!

立即前往