字节Dolphin:多模态文档图像解析模型
Dolphin 是一种新颖的多模态文档图像解析模型,采用‘分析后解析’范式,通过两阶段方法高效处理文本段落、图表、公式和表格等交织内容,实现了卓越的解析效率。
Dolphin 是一种新颖的多模态文档图像解析模型,采用‘分析后解析’范式,通过两阶段方法高效处理文本段落、图表、公式和表格等交织内容,实现了卓越的解析效率。
Dolphin是基于单一视觉语言模型的两阶段文档图像解析模型,采用自然阅读顺序生成元素序列和异构锚点提示进行高效并行解析。支持页面级和元素级解析,性能卓越。