阿里开源首个视觉推理模型,击败GPT-4o,网页一度404 下午10时 2024/12/25 作者 量子位 阿里开源首个视觉推理模型QVQ,能读图像解数学题、算沙发面积等。它在多个基准测试中得分70.3分,超过GPT-4o和Claude 3.5 Sonnet。目前处于实验阶段,存在语言混合、递归推理等问题。