人类秒懂,AI却懵圈:VLM²-Bench揭示视觉语言模型「视觉关联」能力短板 下午11时 2025/03/14 作者 机器之心 本文提出VLM²-Bench评测基准,旨在系统探究视觉语言模型在人类级基础视觉线索关联能力上的表现。通过全面考察通用线索、物体线索和人物线索三个大类的基础关联能力,共涵盖9个子任务及3060个测试案例。