kimi 发布了 Kimi-Audio-7B-Instruct

kimi 刚发布了 Kimi-Audio-7B-Instruct，支持语音识别（ASR）、音频问答（AQA）、音频字幕（AAC）、语音情感识别（SER）、声音事件/场景分类（SEC/ASC）、文本到语音（TTS）、语音转换（VC）和端到端语音对话。

参考文献：
[1] 论文地址：https://github.com/MoonshotAI/Kimi-Audio/blob/master/assets/kimia_report.pdf
[2] 模型地址：https://huggingface.co/moonshotai/Kimi-Audio-7B-Instruct
[3] repo地址：https://github.com/MoonshotAI/Kimi-Audio

知识星球服务内容：Dify源码剖析及答疑，Dify对话系统源码，NLP电子书籍报告下载，公众号所有付费资料。加微信buxingtianxia21进NLP工程化资料群。

（文：NLP工程化）

一	二	三	四	五	六	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30

发表评论 取消回复

下载每时AI手机APP

发表评论取消回复