Github揽获1.6K星!南大、腾讯发布VITA-1.5: 迈向GPT-4o级实时视频-语音交互 下午4时 2025/01/09 作者 PaperWeekly 近年来,多模态大语言模型(MLLMs)主要聚焦在视觉和文本模态的融合上,对语音的关注较少。然而,语音
自动评估基准 | 一些评估测试集 下午10时 2025/01/08 作者 Hugging Face 近年来开发的评估数据集列表,但由于LLM的发展而可能不再适合当前评估方法。部分数据集在互联网上公开多年。