我们用NotebookLM把半佛仙人演讲变成了播客,发现它还不是最强的


作者 | Kino
编辑 | 张洁


最近,谷歌旗下大火的NotebookLM支持中文后,在业内引起了不少讨论。


无论PDF文件、纯文本,还是网站、YouTube视频链接,都可以直接丢给它,让它一键转播客。


听起来是不是不觉明厉?


我们拿出不久前半佛仙人在新榜内容节上的演讲《半佛仙人:那些社会毒打教我的事》试了试,不得不说,效果确实超出预期。(建议大家先扫一眼文章内容,再来听这期音频)



这期时长7分钟的“节目”中,两位“AI主播”很自然地用对话聊天的方式,复盘了这篇文章的主要内容。


看得出,NotebookLM应该是对人类的聊天方式略有研究,特意让这场对话没那么的“连贯”,两位主播一定程度上的“停顿”“磕巴”“感叹语气”,都让这个内容看上去更有“人味”了一点。


他们甚至有点像两个相声演员,一个主讲,一个捧哏,还见缝插针地进行点评和总结,不仅节奏流畅,提炼的观点也还算准确和简洁,基本没什么照本宣科的感觉。


当然,这样的内容能否被播客市场上的听众们接受,恐怕还要打上一个问号。但考虑到AI确实为播客的内容创作提供了更多可能性,而且一切才刚刚开始,我们认为“AI生成播客”还是有进一步探讨的价值。


本文,我们筛选盘点了几款市面上表现较为突出的AI播客工具,梳理了每款产品的功能特点、能力边界和定价策略,希望能给大家提供一点实用参考。


需要简单说明的是,本文所说的“AI播客工具”,指的是AI辅助或直接完成播客内容生成、编辑、优化等工作的软件或平台,而非AI凭空生成播客节目内容。


总的来说,这类工具的功能往往涵盖:基于提示词生成播客脚本、文本转语音(TTS)生成主持人和嘉宾对话、AI自动剪辑与降噪(去填充词),甚至可以直接基于文本、网页链接或视频一键生成完整播客。具体来说又大致分为以下三类:


一体化播客创作平台:从播客脚本、合成语音到分发,覆盖整个播客制作流程,如Podcastle、Wondercraft等。


AI语音与TTS平台:在AI语音的真实度、多样性和定制化方面表现突出,如ElevenLabs等。


AI增强型编辑与后期工具:在剪辑、降噪、填充词和口癖去除等方面,用AI简化和加速后期制作流程,如Descript、Adobe Podcast、Riverside等。



NotebookLM


首先还是先聊聊最近热度最高的AI播客工具NotebookLM。


实际上,NotebookLM的定位更像是一个研究/学习助手,并非通用的播客制作平台。


如果你想对输出的音频和脚本进行精细化编辑、替换音色、调整语气节奏等,那它的功能还不算完整。但NotebookLM引起的热议,也的确让更多人重新审视AI在播客内容生产中的潜力。


双AI主持人的讨论形式是NotebookLM的一大特色,相比单调的文本转语音朗读,这种形式显然更生动有趣,更易于听众接受,理解和消化信息。


基于我们自身的使用体验和其他用户的反馈,两个AI主持人的声音还是非常接近真人且富有情感变化的,脚本质量也较高。 


从上传源文件到生成音频概览,整个过程非常丝滑。而且NotebookLM生成的内容严格基于用户提供的源材料,并能提供引文出处,有助于确保信息准确性和降低幻觉。 


最近,NotebookLM还上线了一个“交互式音频概览”的新功能,允许用户在收听音频概览时“加入”与AI主播的对话,可以提问并获得基于源文档的个性化回答。


不过,据我们观察,NotebookLM输出内容的质量在很大程度上依赖于输入文档的结构清晰度和内容质量。如果输入材料过于零散或混乱,可能导致输出效果不佳。


另外,NotebookLM输出音频的可控性也十分有限,目前仅支持调节播放速度。在超出初始提示词范围的脚本精细控制、音频编辑、音效库、播客托管等方面,仍不如专业的播客工具。


这就意味着,虽然NotebookLM在其核心应用场景下非常强大,但对于那些希望从零开始创作播客、进行访谈录制,或者需要高度创意控制的用户来说,则需要寻求其他替代方案。



ElevenLabs



ElevenLabs可以说是当前AI文本转语音(TTS)和语音克隆领域的明星领头羊,而播客正是其核心应用场景之一。


在平台的Studio工具中,选择Create a podcast,上传文档或提供网页链接,即可自动生成完整播客内容。支持的输入格式包括.epub、.pdf、.txt、.html和.docx文件,也可以直接导入已有项目或通过URL抓取网页内容。


在生成设置方面,可以选择播客的呈现格式,其中,Conversation以主持人与嘉宾之间的对话形式呈现,适合轻松自然的交流内容;Bulletin聚焦于主持人单人播报的更新信息,更偏向简洁高效的内容。



此外,还可以灵活设定播客的时长为Short(短)、Default(默认)或Long(长),系统将基于原始文档内容长度与格式偏好自动调整播客篇幅。


在语音方面,支持自定义主持人与嘉宾的声音,除了默认的Chris和Jessica外,还可以从语音库中选择已有声音,或者按需生成新的语音。平台支持即时语音克隆(Instant Voice Cloning)和专业语音克隆(Professional Voice Cloning)。


在定价方面,ElevenLabs采用基于积分用量的阶梯式定价,提供从免费试用到业余创作者、专业创作者和企业定制的多个版本。


入门版起价为5美元每月,创作者与专业版分别为22美元和99美元每月,针对更大规模的使用场景还提供330美元每月和1320美元每月的高级套餐,以及面向企业的定制服务。




Monica


Monica是一个一站式AI工具集成平台,功能覆盖AI模型调用、图像处理、PDF翻译、音频转写、AI视频总结、AI生成播客等多个领域。你能想到的AI能力,几乎都能在它家菜单栏里找到。



值得一提的是,Monica背后的团队来自中国,也是当前出海AI创业中的典范。


在播客的内容来源方面,Monica接受URL(网站、YouTube)、文件(PDF、Doc)和纯文本作为输入源。


在语音部分,用户可以选择不同的播客主持人(Emily或Michael),音频生成后,平台也提供基础的微调功能,允许用户对内容做适度编辑。Monica支持在多个平台上使用,包括iOS、Android、Windows、Mac和Web端,并支持内容同步,方便跨设备操作。


定价方面,Monica采用的是基于积分的使用机制,播客功能通常会消耗“高级积分”,需要通过订阅或单独购买额外获取。平台提供免费额度供新用户体验,付费版本(如 Pro、Unlimited)则可以获得更高数量的积分。



Podcastle.ai



Podcastle将自己定位为“一体化的视频与播客制作平台”,覆盖从录制、编辑到托管与分发的整个播客内容创作流程。


在音频处理方面,平台支持文本转语音功能,内置超过1000种AI语音选项,并提供语音克隆服务,可用于定制个性化播音风格。其中,Magic Dust AI功能可以进行AI降噪、静音检测和去除填充词(如“嗯”、“啊”等)。


平台还设有Hosting Hub,用于托管节目并自动分发至主流播客平台。此外,还支持音频转录、添加配乐和音效等。


目前,Podcastle共提供三个付费套餐,均按年计费,支持免费试用:


Essentials(11.99美元每月):适合基础用户,提供不限时音频录制、8小时视频录制、10小时音频转录与字幕服务、20万字符的TTS额度以及高分辨率下载权限。


Pro(23.99美元每月):为进阶创作者提供更大额度,视频录制上限提升至20小时,转录与字幕上限提升至25小时,TTS额度提升至50万字符。


Business(39.99美元每月):面向高频使用者和团队,支持50小时视频录制、100小时转录与字幕生成,TTS额度高达200万字符。


所有套餐均包含完整的AI音频与视频工具包,功能涵盖录制、剪辑、文字转语音等核心服务。



Wondercraft



Wondercraft是一个以AI驱动的音频工作室,致力于帮助用户将博客文章、文档、链接或创意想法,快速转化为成品播客、有声读物甚至广告。


用户可以直接输入提示词或上传原始材料(如博客文章或URL),AI会自动生成结构化的播客脚本,将文本转写为对话式内容。如果出现逻辑不通、语气僵硬的情况,仍需人工审校调整。


在语音合成方面,Wondercraft内置了多种AI语音模型,包括ElevenLabs、Gemini、OpenAI和Cartesia等主流引擎,语音库支持50种语言,并可将原文翻译成18种语言进行配音,甚至可以区分地区方言。此外,它还配备了一个AI驱动的音效生成器和免版税音乐库。


在后期编辑上,Wondercraft提供了可视化时间轴编辑器,你可以将生成的AI语音、背景音乐、音效混合在一起,也能逐行精调语速、语气甚至音调。Parrot Mode(鹦鹉模式)可以克隆语音,Director Mode(导演模式)可以加停顿、语气词、笑声等



协作能力也是Wondercraft的一大亮点,平台允许团队成员共同编辑、审批内容,比较适合品牌或企业机构使用。



Jellypod


Jellypod是一个定位于入门级播客创作场景的AI播客生成平台,覆盖整个播客生命周期,在其付费套餐中,用户可以将播客通过RSS feed分发至Spotify、YouTube等平台。


目前,Jellypod支持以文档、URL等作为输入来源,系统会根据这些内容生成播客脚本。


比较有辨识度的功能,是“创建AI主播角色(Host)”这一块,不仅可以换音色,还能给主持人定制人设。比如Jellypod有两个默认的AI主持人模板,一位是拥有多年播客经验的英式男声Eric,另一位是充满热情的年轻女性Ruby,声音真实自然,主持风格偏激发听众共鸣感。




从定价体系来看,Jellypod提供免费使用的Basic基础套餐,适合体验功能与初步测试。更高阶的付费套餐包括Starter(24美元/月)、Creator(47美元/月)与Business(150美元/月),分别对应不同数量的积分和功能权限。





过去,制作一档播客往往意味着脚本撰写、语音录制、剪辑混音等一整套繁琐流程。而现在一个越来越明显的趋势是,AI正在推动播客创作变得更高效、更普及。


借助这类工具,即使没有创作经验或专业设备,个人创作者、小团队也能制作出听感不俗的播客内容,既降低了入门门槛,也拓宽了创作空间。


目前,市面上AI播客工具在不同维度展现出了各自的特色,但真要做出一档像样的播客,靠一个工具打天下是不太现实的。


比如NotebookLM胜在信息提炼和脚本生成,但ElevenLabs、Wondercraft、Podcastle等则在语音定制、剪辑、情绪控制、发布流程上更专业。所以,组合拳才是解法播客创作者可能需要组合使用多个工具,才能满足完整需求。


ps. 你能接受AI生成的播客内容吗?欢迎评论区交流。





(文:AI新榜)

发表评论

×

下载每时AI手机APP

 

和大家一起交流AI最新资讯!

立即前往