小红书、上交发布多模态大模型新基准,Gemini 1.5 Pro准确率仅48% 下午11时 2025/02/28 作者 PaperWeekly WorldSense ,一个全新的基准测试,用来 评估多模态大模型(MLLMs)的多模态真实场景理
小红书&上交多模态大模型新基准,Gemini 1.5 Pro准确率仅48% 下午11时 2025/02/12 作者 量子位 如何? 有新基准来衡量了。 就在最近,小红书和上海交通大学联合提出 WorldSense ,一个全新