GraphRAG的优劣势及文档解析结合RL强化学习新思路Infinity Parser

在2025年6月11日的文章中,探讨了《Infinity Parser》结合强化学习和文档解析数据集的构建,并介绍了《When to use GraphRAG: A Comprehensive Analysis for Graph Retrieval-Augmented Generation》,分析了GraphRAG在不同场景下的有效性。

真实场景下文档解析中的2大类8个常见问题:目录层级解析、布局检测、阅读顺序及长表格拼接

2025年6月10日,北京晴。本文讨论了文档解析处理中的检测问题和语义解析问题,包括布局检测、阅读顺序识别、背景干扰、ppocrv5模型精度、跨页表格合并等问题,并提出了解决方案。

有趣思考:如何带着问题去针对性学习-兼看大模型推理、强化、RAG等进展

今天是2025年6月6日,星期五,北京晴。文章回顾了大模型相关技术进展,包括针对性学习、推理数据收集、多模态应用及强化学习评估偏差等内容。关键点在于明确问题并针对性学习,学会提问和理论与实践结合,以提升大模型性能。

RAG的有趣新尝试:将文本编码进MP4文件实现思路及Agentic-doc处理文档

今天是2025年6月5日,星期四,北京晴。文章介绍了将文本编码进MP4文件的有趣RAG尝试和Agentic-doc文档处理系统。Memvid项目通过MP4索引实现快速语义搜索,而Agentic-doc则利用agent高效提取复杂文档结构化数据。

强化学习数据合成框架SynLogic及语音大模大模型评估

2025年5月29日,北京晴。文章介绍了大模型推理及语音模型评估进展和数据合成框架SynLogic的最新情况,包括DeepSeek-R1更新、LALM-Evaluation-Survey项目以及用于生成多样化的逻辑推理数据的SynLogic框架。