全面评估多模态模型视频OCR能力,Gemini 准确率仅73.7% 下午4时 2025/05/30 作者 量子位 MME-VideoOCR团队评估MLLM在视频OCR中的能力,构建精细任务体系和高质量数据集,揭示了当前模型的局限性,并提出了优化建议。