MME-VideoOCR 归档 - 每时AI

全面评估多模态模型视频OCR能力，Gemini 准确率仅73.7%

2025年5月30日16时作者量子位

MME-VideoOCR团队评估MLLM在视频OCR中的能力，构建精细任务体系和高质量数据集，揭示了当前模型的局限性，并提出了优化建议。