13天涨粉22万！全美爆火的“宝宝播客”，靠什么拿下2亿美金估值？

全世界的明星都有了“宝宝播客”，我的X、TikTok被刷屏了！

这些爆款视频中，“AI宝宝”不仅样貌与名人神似，表情、嘴型和动作也都非常生动，充满表现力。视频动辄千万播放、百万点赞，相关账号如“babypodcast”13天涨粉超22万。

其幕后推手——Hedra也美美宣布完成由a16z领投的3200万美元A轮融资，估值高达2亿美元。

Hedra因AI对口型工具而出名，以“角色可控”和强调细腻的表现力，打败了一众视频工具。与此同时，它也是一个集成外部模型的“全模态”平台，以“复杂流程模块化”的思路，解决生成式AI工具过于零散的痛点。

今天，我们将拆解这种“宝宝播客”的爆红密码，并探究背后工具Hedra的魔力。

/ 01 /

“可爱”又一次赢了，

拆解Hedra的“全模态”制作平台

“宝宝播客”的核心配方是以“名人萌化+成人叙事”制造猎奇效应，形成独特的传播裂变因子。

国外的喜剧表演通常神态夸张、内容辛辣，这与表情娇憨、不谙世事的婴儿形象形成了强烈的反差。

这类内容深谙“借势传播”，制作门槛也很低。

创作者直接截取现有的爆款内容，例如TheoVon等喜剧演员的经典台词、《1000-Lb.Sisters》真人秀的争议片段，利用原内容自带的粉丝基础和话题度，让“AI宝宝”二次演绎。

▲喜剧人JonLajoi制作的婴儿采访狗播客成爆款视频

这类视频的制作手法非常简单，全程可在Hedra Studio上完成。这个平台以Hedra自研的Character-3模型为核心，生成与编辑一体化，三步可结束战斗：

①GPT分析名人特征，生图模型制作其宝宝形象

GPT反推名人特征提示词，即梦、Midjourney等图片模型生成对应的婴儿形象。还需预留面部动态空间，比如张开的嘴巴、自然的表情，为后续口型同步做准备。

举例：photo realistic elonmuskasa baby in a teslat-shirt sitting in front of apodcastmic，elonmusk face（埃隆·马斯克婴儿形象，穿着特斯拉T恤，坐在播客麦克风前，埃隆·马斯克的脸部特征）

②给“AI宝宝”配音，音源可生成或截取

声音可以截取热门播客或影视片段的原声；而定制化内容靠ElevenLabs、MinimaxSpeech02等语音模型生成，可选择沙哑、戏谑或夸张的音色以强化喜剧效果。

③让“AI宝宝”“说话”

将图像与音频上传至Hedra 后，Character-3模型开始发挥作用：它会先分析婴儿面部的关键点（如嘴角、眼球、眉毛），再根据音频的音高、节奏和语义情感生成对应的微表情。

▲“AI宝宝”歇斯底里的表情，还原了《Top Gear》主持人的风格

Hedra不仅仅是将人物的嘴巴与语音匹配，还能让表情和姿态与语音内容高度一致。

比如，当音频中出现笑声时，AI会同步触发“宝宝”眯眼、嘴角上扬的动作。其音画同步的精度可达毫秒级，甚至能模拟吞咽、眨眼等细节，让静态图像产生近乎真人的生动感。

事实上，在“宝宝播客”病毒传播之前，Hedra就因制作吉卜力风格的播客视频小火过一次。

两次爆火反应了一个内容趋势——成人对可爱风格（包括动画美学、可爱文化、简化视觉语言）的接受度很高。

剑桥大学实验数据，人类大脑处理卡通形象的情感反应速度比真人快0.3秒。AI营销可用婴儿/吉卜力等低威胁性形象承载复杂的信息内容。

Hedra成立于2021年，自2024年推出Character-3模型以来，迅速积累300万用户并筹集了资金：

2024年8月完成1000万美元种子轮投资
2024年11月完成由a16z领投的3200万美元A轮融资
今年3月获得亚马逊Alexa基金的投资

公司目前估值达2亿美元，累计融资4400万美元，核心用户群为专业创作者和营销人员。目前团队规模仅20人，预计将迅速扩张至三倍规模。

/ 02 /

2年融资4400万美元，

可控性是破局关键

“宝宝播客”AI技术对内容生产范式的一次试探。

Hedra价值不仅在于娱乐层面的流量变现，Hedra透露，其未来计划重点拓展企业营销领域的应用场景。

今年6月，Hedra在其科技周活动上积极与创作者互动，并展示其在企业服务等方面的可能性。当Hedra Character-3模型的动态生成能力可与数字人技术结合，或将大幅降低企业客服、虚拟偶像影视配角的制作成本。

放眼整个生成式AI领域，竞争不可谓不惨烈——Captions、HeyGen、Synthesia和Runway等热门公司都在围绕视频和虚拟形象构建技术。

众多工具卷4k、卷画面精美度，生成的内容仍然时常出现“恐怖谷”——动作僵硬、表情空洞，缺乏人类细腻的情感层次。

Hedra做了两步，来打破这种“恐怖谷”。

首先，Hedra是可控的。

通过GPT解析名人特征→生图模型生成婴儿版IP→动态绑定表演风格，Hedra将原本“不可控的艺术表现”转化为“可量产的精准情感触达”，实现IP的低成本萌化再造。

第二，Hedra测重于人物的表现力。

其“面部选择”和精确的唇形同步控制等功能，无不体现团队对时间、情绪协调和差异化角色表达的敏感度。

Hedra创始人Michael Lingelbach本人曾是舞台剧演员，他对于人物的动态演绎有着很深的理解。

通过可控和表现力，Hedra面向营销市场完成了对品牌的适配。

另外，零散的生态是生成式AI工具的一大痛点。

例如，HeyGen最长能制作30分钟的视频，但多角色协同生成仍是短板。少数支持双角色生成的工具如TalkingAvatar AI，仍需搭配Notebook LM使用，流程繁琐且兼容性有限。

Hedra平台集成外部模型，具备“文本输入-图像生成-语音合成-多角色动画-智能剪辑”的全流程能力，能根据用户设定的风格自动匹配技术参数。

今年6月，Hedra更新了“人脸选择”功能，允许用户在多角色场景中选择角色的脸部“开口说话”，补上了多角色生成的短板。

正如Hedra创始人谈道：“未来的创作者不应是工具操作者，而应专注于创意本身。技术需要成为隐形的基建，而非显性的门槛。”

文/朗朗

PS：如果你对AI大模型领域有独特的看法，欢迎扫码加入我们的大模型交流群。

（文：乌鸦智能说）

一	二	三	四	五	六	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30

发表评论 取消回复

下载每时AI手机APP

发表评论取消回复