WER 归档 - 每时AI

月之暗面最新开源模型！Kimi-Audio：革新多模态音频处理，统一音频理解、生成与对话！

2025年4月28日8时作者开源星探

Kimi-Audio 是一款由 Moonshot AI 开源的音频基础模型，基于 Qwen 2.5-7B 构建，支持 ASR、AQA、SER 等多种任务，具有高效流式生成和开源评估工具包等特性。

2025年3月21日11时作者机器之心

OpenAI 发布了新的音频模型，实现了语音转文本技术的重大进步，这些模型改进了单词错误率，并在多个既定基准中表现最佳。