
播客录制和编辑平台 Podcastle ,如今也加入了 AI 文本转语音竞赛,发布了其名为 Asyncflow v1.0 的 AI 模型。同时,还将为开发者提供 API,使他们能够直接将文本转语音模型集成到自己的应用中。
得益于新模型,该公司能够提供超过 450 种 AI 语音来叙述您的文本。这家初创公司表示,它以降低训练和推理成本的方式开发了这项技术和模型,使其在竞争中占据优势。
随着这一举措,Podcastle 加入了包括 ElevenLabs、Speechify 和 WellSaid 在内的多家初创公司行列,这些公司已开发出技术和 AI 模型,能够将任何类型的文本转换为由 AI 配音的音频片段。该技术覆盖了营销、广告、内容创作、教育和企业培训等多种应用场景。
Podcastle 的创始人 Arto Yeritsyan 表示,公司一直想构建一个文本转语音模型,但训练成本和数据需求非常高。
“自成立以来,我们就希望构建一个强大的文本转语音模型。然而,开发成本非常高。得益于最近大型语言模型的发展,我们去年取得了突破,能够在不需要大量数据的情况下构建出高质量的语音模型。”Yeritsyan 说。
该公司去年的 1350 万美元 A 轮融资也为其努力提供了助力。
Yeritsyan 表示,Podcastle 每 500 分钟的文本转语音收费约为 40 美元,而 ElevenLabs 的相同服务则收费 99 美元。
本文翻译自:Techcrunch
编译:ChatGPT
(文:Z Potentials)