VITA团队归档 - 每时AI

超低延迟的端到端语音模型！首次生成音频仅需53ms，比同级别模型快3-5倍！

2025年5月16日8时作者开源星探

VITA-Audio是一款由VITA团队开源的端到端语音模型，首次生成音频仅需53毫秒，比同类7B参数模型快3-5倍。它具有超低延迟、首向前向传播生成等优势，并支持多种任务。