
作者 | 阿虎
编辑 | 张洁
一只举着自拍杆的水豚(卡皮巴拉),最近成了TikTok上正当红的旅行博主。
视频中,它手拿自拍杆精神奕奕地说着开场白:“大家好吗?复制版的卡皮巴拉又带来新的Vlog啦!今天,我要带你们去我最喜欢的地方……”
这支靠谷歌Veo 3生成的AI视频,在TikTok上播放量超580万,获赞超84万。卡皮巴拉的表演和台词几乎看不出任何破绽,俨然是一位镜头感极强的专业视频博主。
发布视频的账号“CapiPapiofficial”自6月1日发布第一条Vlog起,在15天内共发布16条Vlog视频,目前粉丝数超89万,累计获赞数超1340万。
不仅如此,最近一周,X、Instagram、抖音等海内外平台重新掀起一阵Vlog热潮,只不过都是AI“拍”的。在AI的助力下,考拉、大脚怪、古代中东人、洞穴人都“创建”了自己的视频账号,摇身变资深Vlogger。
相关视频在TikTok上动辄收获超百万播放,获赞几十万。在Instagram上也有一些专门制作此类内容的账号,同样迅速走红。此前《星球大战》的冷酷风暴兵账号,创作者在三天内涨粉超30万,让人一度怀疑AI起号也如呼吸般简单。
为什么这类第一人称Vlog会让网友如此上头,引发大量模仿?我们试着拆解了几个热门账号,根据背后的工作流程,并制作了一条第一人称视角视频。

单条视频播放超1600万,
AI Vlog风靡互联网
虽然Vlog已经是一条成熟的内容赛道,但AI生成“真人感”Vlog还是俘获了一众网友。
据“AI新榜”观察,这些视频通常会顶着不同动物的形象,再以人类的口吻述说一些观点独特的吐槽向语录。除卡皮巴拉外,最早在这条Vlog赛道上走红的主角是“Yeti”(雪怪),一种介于人与猿之间的生物。(注:“Yeti”这个词起源于喜马拉雅地区,当地人称其为“雪怪”,它被描述为一种介于人与猿之间的生物,至今尚未有确切的证据证明其存在。)
此类Vlog中,“Yeti”的设定是一个“荒野求生的网红”。他会背着自己的大行囊到商场购物,在自己的冰洞里生火烧烤。他也会用愤世嫉俗的方式吐槽人类世界的食物、设定和规则,夸张又口无遮拦的发言引得评论区网友纷纷产生共鸣。
部分评论区截图
Vlog看重的是人物角色的个性表达和故事的完整性。当“喜马拉雅地区的雪怪”这种神秘假想的生物出现在人类世界,首先视觉效果上就很吸睛。
创作者还巧妙地在荒野场景中融入生活元素,比如雪怪们凑一起围炉煮茶、逛街购物。这种巨大的反差感,既形成了连续的故事情节,也增添了荒诞幽默的笑点,让整个视频变得极有节目效果。
截至目前,“yetivloglife”共发布12条视频,其中最高一条播放量超1600万,获赞超250万,这一热门视频得益于Vlog博主之间的合拍。
创作者将“Yeti”和另一热门角色“大脚怪”用AI进行联动,生成了他们一起探险的故事。
“Yeti”系列走红之后,一大波创作者踏浪而来,打造了形形色色的Vlog博主。上述被网友们戏称为“大脚怪(big foot)”的角色,在这一轮AI Vlog中同样出圈。
它的视频开篇就营造了悬念和紧张感,通过第一人称视角点明诸如“神秘巨兽”“荒野遭遇”的视频主题,向观众展示“它”所看到的世界,迅速抓住了网友们的注意力。
再加上视频中“自拍+手持跟拍+无人机远景”的镜头组合,配合快速切换的场景、风声和喘息声,共同营造出会既真实又刺激的观感,让人忍不住想看“接下来会发生什么”。
除了拍摄“野外求生”、“雪地探险”等充满悬疑气息的视频外,AI Vlog博主们更多的创作内容则是“旅行记录”。
和前面的“户外博主”设定不同,这些视频内容更轻松,画面场景也更多元,包括但不限于展现庞贝古城、 19世纪的伦敦以及美国工业革命时期的历史画。
通过让观众沉浸式体验历史、电影中的场景,这类账号在海内外平台上获得了大量关注。
据新榜旗下抖音数据工具新抖,抖音博主“现代小辉”从6月12日起发布第一条“体验历史名场面Vlog”,6天内新增粉丝数超1.45万。
视频能火起来,很大程度上在于画面逼真度极高。小红书博主“放空七秒”带网友第一视角体验邮轮旅行,评论区有网友锐评:“还好我留个心眼儿,不然我就吓死了,前三个片段根本看不出来是AI。”
还有一类深受国外网友欢迎的Vlog则是“洞穴人日常故事”。这类视频通常以“赛博神圣感”俘获海外有信仰寄托的网友,主要内容也和亚当夏娃、诺亚方舟等圣经故事息息相关。
这些Vlog中的主角长相不再是精致无暇的超模脸。自然的日光、手持自拍的角度,都把画面中的每个人物都刻画得真实可感。
看上去,他们就是在山区探险的真人博主,在街头偶遇到的普通人,在游轮上一起旅行的情侣,甚至在寒冷的雪地里被冻得说话不利索。
正是因为视频画面“质感真实”,带有极强的拟真效果,让其在短时间内成为了TikTok、Instagram、抖音等海内外平台上流行的内容创作风潮。

打造一条“拟真感”的AI Vlog
这类玩法在外网爆火之后,a16z的Justine Moore在X上发文称,这些视频其实是使用谷歌的Veo 3视频生成模型制作的,并且制作起来“惊人地简单”。
具体制作过程,可以归结于这几个步骤:
首先,需要确定自己的视频主角,为其打造一个具体的人设。雪怪(Yeti)、大猩猩(Bigfoot)、考拉(Koala)都是TikTok上热门Vlogger。
比起其他AI视频,Vlog更注重故事情节和个性表达。
这里可以让Gemini、GPT等扮演电影视频提示词作者,帮我们打造能够形成病毒式传播的YouTube Vlog系列视频。
提示词:Your Role:Act as an expert cinematic video prompt writer. Your goal is to help me create scenes for a viral YouTube vlog series.
现在大语言模型的能力差异并不大,我们可以基于使用习惯、输出内容和优势来选择使用哪个AI。关键之处在于赋予AI具体的人设,来引导生成更为准确的视频想法和提示词。
以“Yeti”角色为例,我将它设定成“一只生活在雪林中的毛茸茸的大型白色雪怪”,具体提示词如下:
The Character & Series:The star is a large, fluffy white yeti who lives in a snowy forest. He vlogs his daily “survival,” but he’s not a rugged expert.
His personality is a hilarious mix of sarcastic, emotionally unstable, and overly dramatic, but he’s ultimately lovable. The series is a parody of influencer culture meeting wilderness life.
之后,我们需要确定镜头数量,进一步让AI生成不同分镜。需要注意的是,为了尽量保证Veo 3能生成连续统一的画面,这里最好让AI按指定格式输出。(完整提示词可在AI新榜后台回复“Vlog”获取)
提示词格式:
场景描述: 一只「巨大的白色毛茸茸雪怪正对着一个围着围巾(外形)」,「用树枝做手臂的雪人比手画脚(动作)」。
镜头角度/风格: 自拍镜头,「用毛茸茸的大爪子抓着抖动的手机,镜头被哈气模糊,背景是积雪覆盖的小屋,雪人“妻子”坐在一根木头上像个女王。」
对白/旁白: 他大声说:「“她已经雪龄八周,现在必须要个Labubu。Labubu到底是什么?我用石头查了一下谷歌——没反应。”」
(「」中的内容可替换)
接着再根据AI给出的不同分镜,让Veo 3生成视频即可。选择Veo 3的主要原因在于它能够为不同角色赋予自然的微表情、动作变化和旁白音效,实现一键直出。
以上述场景为例,Veo 3生成的英文Vlog效果:
最后,把生成的分镜交给剪辑软件进行最后的整合编辑,一起看看效果:
在生成过程中,只要创作者掌握了提示词模版,并合理替换其中的角色名称、动作和情节,Veo 3生成的结果通常能保证可控。
但如果想实现角色一致性,则仍然有一定几率的抽卡风险。以制作“神秘猫猫准备惊喜”Vlog为例,Veo 3在保持猫咪一致性方面就会出现偏差。尽管是不同场景下的同组提示词,Veo 3随机生成了前后两个品种的猫。
首尾两个片段的猫猫出现差异
此外,我们也尝试了豆包视频模型。豆包生成的画面效果真实,但暂不支持对口型功能,需要重新上传画面并配合文本进行AI配音。因此,在视频制作效率方面,豆包就不如Veo 3。
同一组提示词,豆包生成的效果
与其他AI生成工具相比,Veo 3更侧重对角色面部表情、动作和声音的精细控制。这种对“拟真感”的追求,对于打造低成本且真实可信的AI视频至关重要。
另外,Veo 3生成视频效率大幅提升,前阵子,Veo 3上线了Fast模式,生成8秒视频的时间控制在2分钟以内,这也在一定程度上促进了类似AI Vlog视频的病毒式扩散传播。

从全民热舞到Vlog,
爆款短视频都能用AI重做一遍?
2024年,一张照片让全民热舞的短视频,一度刷屏了TikTok。彼时,阿里通义实验室开发的视频生成模型Animate Anyone让不少人过了一把“舞蹈区博主”的瘾。
使用门槛足够低,生成效果可控,视频可玩性足够高,这让普通人对AI有了探索欲和使用欲。
这一轮创作热潮的背后,同样得益于AI能力的提升。
过去,作为一名Vlogger,通常要包办视频的策划、拍摄和剪辑,一个人就是一支独立的拍摄团队。现在从脚本构思、画面拍摄到后期配音,都可以让AI生成。它还能够提供“不同视角”的镜头,在短时间内就能提供信息密度极高的内容画面。
最早一批爆火的AI Vlog创作者们,还顺势推出了在线课程,售卖可复制的提示词模版,详细拆解AI起号全过程,售价25美元。虽然光靠提示词,并不是制作短视频的好办法,但它至少让更多玩家知道可以用AI专门做某类视频,也方便大家去尝试视频的各种可能性。
“AI新榜”此前报道过用AI演绎知识科普内容、AI宝宝说脱口秀拿捏海外网友,以及用AI制作ASMR视频等案例,正如AI Vlog一样,这些案例是用AI实现“像素级”的视频内容复刻,并获得了可观的播放数据。
一个可见的趋势是,在垂直细分领域,创作者们用AI进行内容创作和账号孵化,依然藏着巨大的流量增长潜力。



「
(文:AI新榜)