月之暗面最新开源模型!Kimi-Audio:革新多模态音频处理,统一音频理解、生成与对话! 上午8时 2025/04/28 作者 开源星探 Kimi-Audio 是一款由 Moonshot AI 开源的音频基础模型,基于 Qwen 2.5-7B 构建,支持 ASR、AQA、SER 等多种任务,具有高效流式生成和开源评估工具包等特性。
刚刚,OpenAI开启语音智能体时代,API价格低至每分钟0.015美元 上午11时 2025/03/21 作者 机器之心 OpenAI 发布了新的音频模型,实现了语音转文本技术的重大进步,这些模型改进了单词错误率,并在多个既定基准中表现最佳。