打破多模态数学推理瓶颈:港中文MMLab发布MINT-CoT,将细粒度视觉推理链引入数学领域

港中文 MMLab 提出的新方法 MINT-CoT,通过引入‘视觉交错思维链’实现细粒度视觉与文本推理融合,在多个基准数据集上刷新 SOTA,显著提升多模态大模型在数学视觉任务中的表现。