2710归档 - 每时AI

腾讯混元团队提出MM-IQ：多模态大模型推理评估新基准

下午4时 2025/02/27 作者 PaperWeekly

腾讯 Hunyuan 团队提出 MM-IQ 基准测试框架，旨在评估多模态模型的抽象推理和逻辑思维能力。该基准包含 8 种不同推理范式，涵盖 2,710 个精心策划的测试项目，涉及逻辑运算、数学推理等多样化的题目配置。