准确率最高只有48%?现有多模态大模型迎来大考!小红书&上海交大发布WorldSense基准 下午11时 2025/02/13 作者 极市干货 专门用于评估多模态大模型(MLLMs)在真实世界场景中全模态理解能力的基准测试集。研究发现现有的开源