Dia-1.6B归档 - 每时AI

开源TTS领域迎来重磅新星！Dia-1.6B：超逼真对话生成，开源2天斩获6.5K Star！

上午8时 2025/04/24 作者开源星探

由Nari Labs开发的Dia-1.6B因其逼真的对话生成能力而受到关注，仅开源两天便在GitHub收获了6.5K+Star。它支持多角色对话、拟人化表达、零样本声纹克隆等功能，并且运行效率高，音质媲美ElevenLabs和Sesame。

下午11时 2025/04/23 作者量子位

Nari Lab的Dia-1.6B模型通过开源和微调技术实现了高质量的人声对话生成，支持多种音色、语气和效果，目前在单卡配置下每秒可生成约40个token音频。两位韩国学生仅用3个月便自主开发完成此项目，使用谷歌TPU资源训练模型，并计划将其发展为一款完整应用。

下午11时 2025/04/23 作者机器之心

机器之心报导，Dia-1.6B 是一个在 GitHub 等平台上走红的开源语音模型，不仅能生成说话的声音、对话，还能合成真实感强的各种声音。其参数量为1.6B，目前已被下载超过5600次，热度排名Hugging Face第二，已收获大量好评和星标。