kimi 发布了 Kimi-Audio-7B-Instruct

kimi 刚发布了  Kimi-Audio-7B-Instruct,支持语音识别(ASR)、音频问答(AQA)、音频字幕(AAC)、语音情感识别(SER)、声音事件/场景分类(SEC/ASC)、文本到语音(TTS)、语音转换(VC)和端到端语音对话。

参考文献:
[1] 论文地址:https://github.com/MoonshotAI/Kimi-Audio/blob/master/assets/kimia_report.pdf
[2] 模型地址:https://huggingface.co/moonshotai/Kimi-Audio-7B-Instruct
[3] repo地址:https://github.com/MoonshotAI/Kimi-Audio



知识星球服务内容:Dify源码剖析及答疑,Dify对话系统源码,NLP电子书籍报告下载,公众号所有付费资料。加微信buxingtianxia21进NLP工程化资料群

(文:NLP工程化)

发表评论

×

下载每时AI手机APP

 

和大家一起交流AI最新资讯!

立即前往