小红书、上交发布多模态大模型新基准,Gemini 1.5 Pro准确率仅48% 下午11时 2025/02/28 作者 PaperWeekly WorldSense ,一个全新的基准测试,用来 评估多模态大模型(MLLMs)的多模态真实场景理