Nari Labs归档 - 每时AI

开源TTS领域迎来重磅新星！Dia-1.6B：超逼真对话生成，开源2天斩获6.5K Star！

上午8时 2025/04/24 作者开源星探

由Nari Labs开发的Dia-1.6B因其逼真的对话生成能力而受到关注，仅开源两天便在GitHub收获了6.5K+Star。它支持多角色对话、拟人化表达、零样本声纹克隆等功能，并且运行效率高，音质媲美ElevenLabs和Sesame。

两本科生自学3个月复刻谷歌爆款产品，开源AI语音新标杆一天揽获5000星标

下午11时 2025/04/23 作者量子位

Nari Lab的Dia-1.6B模型通过开源和微调技术实现了高质量的人声对话生成，支持多种音色、语气和效果，目前在单卡配置下每秒可生成约40个token音频。两位韩国学生仅用3个月便自主开发完成此项目，使用谷歌TPU资源训练模型，并计划将其发展为一款完整应用。

一天拿下3.4k star，这个1.6B开源模型火了，合成对话超逼真

下午11时 2025/04/23 作者机器之心

机器之心报导，Dia-1.6B 是一个在 GitHub 等平台上走红的开源语音模型，不仅能生成说话的声音、对话，还能合成真实感强的各种声音。其参数量为1.6B，目前已被下载超过5600次，热度排名Hugging Face第二，已收获大量好评和星标。

速递｜两名本科生3个月打造的AI语音模型，挑战谷歌NotebookLM，16亿参数实现自然对话生成

下午4时 2025/04/23 作者 Z Potentials

Two undergraduate students created an AI model that generates podcast-style audio similar to Google’s NotebookLM. Nari Labs’ Dia model, with 16 billion parameters, can generate dialogues from scripts and add prosody, non-verbal cues like coughs and laughs. While the tool runs well and has a simple voice cloning feature, it lacks protection against misuse of generated content.

Nari Labs开源文本转语音模型生成逼真对话并支持情感控制，开源命令行AI助手，供数百个MCP服务器的容器化版本每天自动更新

上午11时 2025/04/22 作者每日AI新工具

近期分享了五款AI技术产品：Dia文本转语音模型、SkyReels V2无限长度电影生成器、Open Codex命令行AI助手、NodeRAG异构图检索增强生成系统以及MCP Containers容器化MCP服务器。

一	二	三	四	五	六	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30