零失误的 AI 主播上岗,但主持人被取代还为时尚早

「地球不爆炸,我们不放假」,这话出自央视主持人朱广权。当时临近 2017 年农历新年,谈到「你们电视台放假吗」的问题,他一本正经地讲了个段子。
但 8 年后,主持人真的可以在春节放假了。负责代班的,是和他们长得差不多的 AI 主播。

视频截取自《杭州新闻联播》
AI 假期代班,真人过年回家拍短视频
谁能想到,传统的电视节目,以一种很新的方式出圈了——蛇年春节期间,除夕至初七,《杭州新闻联播》节目让 6 位 AI 主播值班。
每天,各有两位 AI 主播出镜,轮流口播,形式很像日常的新闻节目。
图片来自:公众号「杭州综合频道」
AI 主播倒也算不上新鲜事,2024 年龙年春节,它们就已经登上了《杭州新闻联播》,但当时只有 2 位 AI 主播,形式是单播。
动图制作自:视频号「杭州综合频道」
除了地方台,AI 主播也已经出现在了更大的舞台上。央视的《2024 中国·AI 盛典》,主持人尼格买提以数字人的形象出现,恰好他所讨论的,就是 AI 会不会取代人类的话题。
网上也不乏一些这样的声音:AI 上岗,真人主播过完年还有班上吗?从《杭州新闻联播》的视频看,AI 主播们虽然吐字清晰、不会出错,但表现还差点意思。
理由包括但不限于:语气欠缺了感情,特别是祝观众朋友新年快乐的时候,有些呆板。虽然会眨眼和轻微摇晃脑袋,但动作幅度很有限,脖子以下基本不动。浅景深的虚化效果,抠图感重,背景看起来有些假……
图片来自:《杭州新闻联播》
播音主持专业毕业、目前从事产品评测编辑的 Obo,以更专业的角度提出了几点意见:
语流语势比较平,起伏不够,所以还是能听出来机器人的机械音。
句末的字尾归音不到位,有一种戛然而止的感觉,突然停下有些突兀,不自然。
采样主持人的声音压嗓严重,胸腔共鸣被严重的压喉影响,听感一般。
副语言不到位,和新年挂钩的新闻,表情却是严肃的,播报内容和脸部副语言脱节。
所以他认为,目前 AI 还无法代替真人主持,「AI 数字人出现挺好的,不用调休了,而且我已经跳出来了」。
但更广泛的电视观众们,不会这样认真「找茬」,可能认不出 AI。其实,真人主播暂时不会被替代,还有一个原因——AI 主播负责播音,那么真人就可以有时间做更多的事情了。
部分真人主播的短视频截图
《杭州新闻联播》AI 主播的形象、声音,是以真人主播为蓝本的。真人主播们回家过年,还不忘拍摄「主播寻年味」系列短视频,介绍家乡的风土人情。以及,和其他打工人一样,他们初八还得回去上班。
Obo 虽然已经不在播音行业,但他在电视台工作的大学同学们,同样有播报日常新闻之外的任务,平时需要策划一些整活向的、年轻人爱看的短视频,过年也被要求拍摄 Vlog。
传播渠道的更迭是一个原因。比起电视节目,短视频不会那么官方和正式,更能拉近主持人和观众的距离,同时也提供了以小见大的视角,让信息更加容易传播,甚至打造出主持人的个人 IP。
但也很难说,其中没有 AI 的影响。看到杭州 AI 主播上岗的新闻后,Obo 和同学们聊起播音主持的未来,他们得出一个结论:「播音员当然会被取代,主持人不会。」
当日常节目可以渐渐由 AI 完成,工作效率直接被 AI 提高,「采编播」里的「播」,显得越来越「不重要」了。但这个「播」是狭义上的,是指天气、交通等「功能性」的播音,像朗诵这样更具艺术性的表达形式,缺乏标准,也更难被取代。
AI 解放了人类主持人的节假日,也倒逼着主持人在播节目之外掌握更多技能,空出时间做更多的「杂活」,扛摄像机、做编辑、写稿子、主持大型线下活动……总之,「主持人的职场空间会被压缩到跟记者一样」。
不嫌苦不怕累的数字人,已经到处都是了
AI 主持人,只是数字人上岗的一种形式。最近,香港大学与字节跳动合作研发的、专为广告视频设计的竖屏 Goku+ 模型,虽然还没能用上,演示效果也令人瑟瑟发抖。官方甚至表示,「以低 100 倍的成本制作广告视频」。
仅通过文本提示词,Goku+ 就能生成逼真的数字人视频,时长可以超过 20 秒,面部表情、手部动作、身体移动都很自然。
不仅如此,基于文本提示词和产品图片,Goku+ 还能生成数字人和产品互动的视频。
但也不用过度焦虑,AI 数字人的作用,目前来说还是单一的。2023 年 9 月,我们写过直播间 24 小时工作的 AI 主播。它们的优点显而易见,便宜、形象可控、掌握多国语言、不嫌苦不嫌累不情绪崩溃。
当时我以买家身份咨询了一家数字人公司,按照真人形象定制数字人,基础版 8000 元一年,高级版 3 万一年,训练素材审核通过后,训练 2 个工作日,平台就能反馈训练成果。
定制形象是一方面,数字人直播是另外的价钱,5500 元一月。我在今年 2 月又咨询了一次,直播还是这个价,支持三种开播方式:自动播,使用提前准备好的直播语料,语音或者文本;阿凡达直播,使用麦克风,真人实时驱动数字人的口型;自动播结合阿凡达直播。
但这家数字人公司,不对效果打包票,「数字人主播仅能替代部分机械化主播的工作,运营岗位相关工作替代不了,所以不承诺任何效果……效果和你的产品、直播内容、拉流量的手段等因素息息相关」。
而且因为数字人的表现仍然和真人有差距,它们也没必要一直站在台前。就像 AI 主持人更适合在假期等非黄金时段代班,直播间的 AI 主播也更适合出现在「垃圾时间」,用来冲直播时长,或者时长 12 到 24 小时的本地生活直播间,拿重复的话术轰炸。
但这不意味着,数字人对真人没有伤害。Obo 认为,AI 主持人可能会让一些播音主持新人失去在「垃圾时间」练嘴的机会,然后影响到他们的就业渠道。同样,先被 AI 直播波及的,会是那些海量的、不知名的、月薪几千、投资回报率更低的「小透明」。
AI 越擅长模仿,人类越强调在场
《杭州新闻联播》AI 主播出圈之后,微博上的一个热搜词条是这样的:AI 播报 0 失误,播音专业学生怎么办。
这就说明了一部分人的观点:AI 能代替真人,是因为它不出错。或者更泛泛而谈,AI 能代替真人,是因为它身上「不人性」的一面。
但这个观点其实恰恰违背了人性,大众喜欢看到平时端正严肃的主持人身上,不那么日常的、更接地气的部分。
主持人出错合集的花絮,因为满足了观众的恶趣味,很容易在视频平台走红。更有代表性的例子是,在一次《新闻联播》中,主持人康辉口播了 20 多分钟,被推上了热搜,他的声音始终保持高度的专业水平,但更让观众记忆深刻的,可能是他播到最后微微泛白的嘴唇,这是一个专业能力顶尖的人类努力的痕迹。
哪怕 AI 可以达到真人的水平,嘴皮子很快,始终不嘴瓢,但那会被认为是理所当然,只有人类肉身完成的,才更容易被记住和在乎。
有时候,这种朴素的、要求人类在场的想法,会逆转技术的潮流。2024 年 10 月,一个波兰广播电台叫停了用 AI 代替人类的实验。
在实验开始的几周前,电台辞退了十几位记者,然后在 10 月推出了三个 AI 主持人,以吸引年轻听众。很快,一位前电台记者和影评人发表了一封公开信以示抗议,「经验丰富的媒体从业者不该被机器取代」。
超过 2.3 万人追随了这位记者并签署了请愿书,还有数百人给记者打去电话,其中许多是年轻人,他们不想成为这场实验的对象。
本来这场实验要持续 3 个月,但一周左右就暂停了,电台对大众的情绪反应感到「非常意外」。其中可能有些「物伤其类」的意味。AP 的报道里写上了这样一句话,「在波兰各地,人们感到愤怒」。
当我和 DeepSeek 聊 AI 主播的话题,它给了我一个很有意思的观点——AI 主播模拟人类点头、眨眼的动作,试图营造「在场感」,但其本质仍是「去身体化」的技术存在,导致 AI 无法实现人类主持人的「具身传播」,无法表达身体和情感的自然共振。
很难说 AI 数字人未来会取代多少岗位,但此时此刻面对 AI 主播时涌起的犹豫和迟疑,不管是出于被取代的恐慌,还是因为相信 AI 无法模拟人类的情感,本质都在表达,我们希望人类在场,尽管这可能只是我们的愿望。
所以,让真人主持人在不播节目的时候拍短视频,实在是一个太有趣的走向了。AI 可以取代强调功能性、程式化的部分,但它没法解答有没有人愿意观看节目的问题。那些表达烟火气息的瞬间,那些更容易传播的片段,仍然需要人类亲身的参与。不再强调效率的时刻,人的在场,就是最重要的前提。

我们正在招募伙伴

📮 简历投递邮箱
hr@ifanr.com
✉️ 邮件标题
「姓名+岗位名称」(请随简历附上项目/作品或相关链接)
更多岗位信息请点击这里🔗

(文:APPSO)

欢迎分享

发表评论