超低延迟的端到端语音模型!首次生成音频仅需53ms,比同级别模型快3-5倍! 上午8时 2025/05/16 作者 开源星探 VITA-Audio是一款由VITA团队开源的端到端语音模型,首次生成音频仅需53毫秒,比同类7B参数模型快3-5倍。它具有超低延迟、首向前向传播生成等优势,并支持多种任务。