语音人工智能初创公司 ElevenLabs 在周三推出了一项功能,允许用户上传不同类型的内容,创建一个多语音播客,类似于Google 的 NotebookLM。
该功能称为 GenFM,可以在公司的 ElevenLabs Reader iOS 应用程序中找到。目前,GenFM 支持 32 种语言,包括英语、印地语、葡萄牙语、中文、西班牙语、法语、德语、日语等。
要使用 GenFM,您首先上传一个 YouTube 视频、文本或文档。然后,该应用程序会自动选择两个声音来创建播客。公司指出,提供了十多种声音可供选择。
当应用程序准备生成 AI 播客时,您可能会看到一个有趣的屏幕,上面写着“撒上一些嗯”和“添加一些深思的停顿”。在一个工具帮助人类去除“嗯”和“啊”的时代, ElevenLabs 正在为其 AI 生成的播客添加人性化元素。
“我们讨论了在对话中引入多少‘嗯’,‘啊’,‘嗯哼’/笑声/呼吸等类似人类对话的填充词或覆盖物——我们的目标是找到自然人类对话与内容实用性之间的正确平衡,”负责 ElevenLabs 移动增长的杰克·麦克德莫特在电子邮件中告诉 TechCrunch。
“当我们观察到那些优秀的长篇播客时,我们发现[更少]的干扰和更自然、更有洞察力的对话流,”他说。“这种体验最终是我们在制作音频叙事时所追求的目标,使其在不同的声音和语言中更易于获取。”
展望未来,ElevenLabs 计划支持更多的自定义功能,并能够添加多个来源以创建生成式 AI 播客。
在九月份,谷歌推出了从用户提供的来源创建 AI 生成对话的功能,名为 NotebookLM。一个月后,该公司增加了用户自定义这些 AI 生成播客输出的功能。
本文翻译自:TechCrunch, https://techcrunch.com/2024/11/27/elevenlabs-new-feature-is-a-notebooklm-competitor-for-creating-genai-podcasts/
编译:ChatGPT
(文:Z Potentials)