音频归档 - 每时AI

音频处理大杀器！Nexa AI 的 OmniAudio – 2.6B 如何让边缘设备 “耳聪目明”？

下午2时 2025/02/05 作者小兵的AI视界

在当今数字化时代，音频语言模型的需求日益增长，
尤其是在边缘设备上实现高效、准确的音频处理更是备受关

上午8时 2025/01/14 作者 NLP工程化

整理和提供了用于构建通用语音、音频和音乐基础模型的数据集列表及其元数据和获取途径，来自sarulab-speech/audio-foundation-model-dataset GitHub。

下午12时 2024/12/22 作者 GitHubStore

Megrez-3B-Omni是无问芯穹研发的端侧全模态理解模型，基于Megrez-3B-Instruct扩展，在图像、语音和文本领域均取得最优精度。