识别高分低能,综合性视觉语言理解新基准,五项挑战评估多模态模型的推理能力 下午4时 2025/02/26 作者 量子位 高分,到了真实世界应用时却表现不及预期,该如何分辨? 新的综合性视觉语言理解基准 JourneyBe