音频模型归档

Aero-1-Audio：Qwen2.5架构加持，轻量级音频模型天花板

下午2时 2025/05/06 作者小兵的AI视界

传统的音频处理模型往往面临参数庞大、计算资源消耗高、难以实时处理长音频等问题。为了解决这些挑战，
L

上午11时 2025/03/21 作者机器之心

OpenAI 发布了新的音频模型，实现了语音转文本技术的重大进步，这些模型改进了单词错误率，并在多个既定基准中表现最佳。

上午8时 2025/03/21 作者 AI寒武纪

OpenAI发布了三种新的先进音频模型：两款语音转文本模型表现优于Whisper，新TTS模型可教AI说话。为了让开发者构建强大的‘语音智能体’，OpenAI推出了三项重要功能：全新语音转文本模型、文本转语音模型和升级版Agent SDK。

下午12时 2025/02/18 作者机器之心

多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，