跨模态理解归档 - 每时AI

识别高分低能，综合性视觉语言理解新基准，五项挑战评估多模态模型的推理能力

下午4时 2025/02/26 作者量子位

高分，到了真实世界应用时却表现不及预期，该如何分辨？
新的综合性视觉语言理解基准
JourneyBe

李飞飞团队统一动作与语言，新的多模态模型不仅超懂指令，还能读懂隐含情绪

下午2时 2024/12/18 作者机器之心

机器之心报道
机器之心编辑部
人类的沟通交流充满了多模态的信息。为了与他人进行有效沟通，我们既使用言