语音识别模型归档

英伟达开源语音识别模型，ParaKeet-tdt-0.6b-v2仅需1秒可转录1小时音频，精准识别劈柴哥演讲

2025年5月27日11时作者 HyperAI超神经

英伟达开源语音识别模型ParaKeet-tdt-0.6b-v2，实现60分钟音频仅1秒处理，适用于实时英语语音转文本。HyperAI超神经官网提供一键部署教程，新用户可获免费资源。

2025年4月3日11时作者 GitHubStore

Dolphin 是由 Dataocean AI 和清华大学合作开发的多语言语音识别模型，支持40种东方语言和22种汉语方言。它在210,000小时的数据上训练完成，包含专用数据集和开源数据集。该模型能执行语音识别、VAD、分割和LID任务。