继续看真实场景下文档解析的8个另外问题:公式输出重复、阅读顺序评测等

今天继续记录一些关于文档解析的问题,包括内容遗漏、公式重复输出、大写识别、阅读顺序评测、合并页面和幻觉问题等8个典型问题,并探讨了这些问题在实际业务中的解决方案和理解。

再思考文档解析最新趋势方案及7类真实场景下文档解析Badcase记录

2025年6月17日,北京晴。文章总结了文档解析中的实际问题,包括目录层级解析、布局检测、阅读顺序及长表格拼接等8个小问题,并探讨了先做版面分析、多任务模型的经典显存问题、下划线解码等问题。

GraphRAG的优劣势及文档解析结合RL强化学习新思路Infinity Parser

在2025年6月11日的文章中,探讨了《Infinity Parser》结合强化学习和文档解析数据集的构建,并介绍了《When to use GraphRAG: A Comprehensive Analysis for Graph Retrieval-Augmented Generation》,分析了GraphRAG在不同场景下的有效性。