视觉推理模型QVQ归档

阿里开源首个视觉推理模型，击败GPT-4o，网页一度404

下午10时 2024/12/25 作者量子位

阿里开源首个视觉推理模型QVQ，能读图像解数学题、算沙发面积等。它在多个基准测试中得分70.3分，超过GPT-4o和Claude 3.5 Sonnet。目前处于实验阶段，存在语言混合、递归推理等问题。