识别高分低能,综合性视觉语言理解新基准,五项挑战评估多模态模型的推理能力 下午4时 2025/02/26 作者 量子位 高分,到了真实世界应用时却表现不及预期,该如何分辨? 新的综合性视觉语言理解基准 JourneyBe
首个可保留情感的音频LLM!Meta重磅开源7B-Spirit LM,一网打尽「音频+文本」多模态任务 下午8时 2024/12/15 下午1时 2024/11/22 作者 新智元 新智元报道 编辑:LRS 【新智元导读】 Meta最近开源了一个7B尺寸的Spirit LM的多模态