ACL 2025 高分接收|高感情语音技术:逻辑智能小语种TTS破局之道

逻辑智能团队提出的数据优化驱动的声学建模框架成功打造了接近真人水平的泰语 TTS,覆盖语音、文本和注释三大类专项数据集,并采用先进的预处理流程。该模型支持高保真语音合成及零样本声音克隆,实验结果显示其在多场景下的优异性能。

说句话就能飞!北航发布语言交互的无人机控制模型

北航团队提出Flying-on-a-Word(Flow)范式,通过模仿学习使无人机理解并执行基于自然语言指令的短距飞行任务。采用大规模真实数据集和协作策略,在北京航空航天大学开放场景成功部署VLA系统控制无人机。