新型开源端到端 AI 语音模型!Voila:195ms 超低延迟引领全双工对话!

语音交互技术的进步改变了人机对话方式。Maitrix团队发布了全双工、低延迟的Voila开源AI端到端语音模型,支持多语言识别与翻译,并提供了多种个性化角色设置功能。

NotebookLM 音频“说中文”了,AI帮助积累资料、生成大纲、挖掘洞见,网友:被低估的神器。

Google CEO Sundar Pichai 推出了NotebookLM新功能:Audio Overviews (音频概述),支持50多种语言,包括中文。NotebookLM能将上传的资料生成引人入胜的“深度探讨”音频总结,支持多种格式文件。