视觉文本理解归档 - 每时AI

NeurIPS 2024 感知理解生成三合一！TextHarmony定义OCR多任务统一新范式

2025年6月20日23时作者 PaperWeekly

，首次在 OCR 领域实现了视觉文本感知、理解与生成任务在单一模型中的统一，有效缓解了多模态生成中的