ICLR 2025|小米新一代Kaldi语音识别算法CR-CTC,纯CTC性能实现SOTA 下午4时 2025/02/07 作者 机器之心 多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,
首个可保留情感的音频LLM!Meta重磅开源7B-Spirit LM,一网打尽「音频+文本」多模态任务 下午8时 2024/12/15 下午1时 2024/11/22 作者 新智元 新智元报道 编辑:LRS 【新智元导读】 Meta最近开源了一个7B尺寸的Spirit LM的多模态