文本转语音模型归档

一天拿下3.4k star，这个1.6B开源模型火了，合成对话超逼真

2025年4月23日23时作者机器之心

机器之心报导，Dia-1.6B 是一个在 GitHub 等平台上走红的开源语音模型，不仅能生成说话的声音、对话，还能合成真实感强的各种声音。其参数量为1.6B，目前已被下载超过5600次，热度排名Hugging Face第二，已收获大量好评和星标。

2025年3月21日16时作者新智元

的时代正式开启了！现在可以利用新的语音模型，指导GPT-4o的说话语气：想温柔就温柔，让疯狂就疯狂！

2025年3月8日8时作者 NLP工程化

OCTAVE TTS首个理解说话内容的文本转语音模型，音频质量、自然度超70%用户偏好，能生成多样化语音。

2025年2月11日12时作者每日AI新工具

本文介绍了五个开源项目：Zonos-v0.1（多语言TTS模型）、Nanospeech（文本转语音系统）、Potpie（AI代理创建平台）、Zotero PDF2zh（PDF翻译插件）和Open Deep Research Web UI（AI研究助手）。