GraphRAG的优劣势及文档解析结合RL强化学习新思路Infinity Parser
在2025年6月11日的文章中,探讨了《Infinity Parser》结合强化学习和文档解析数据集的构建,并介绍了《When to use GraphRAG: A Comprehensive Analysis for Graph Retrieval-Augmented Generation》,分析了GraphRAG在不同场景下的有效性。
在2025年6月11日的文章中,探讨了《Infinity Parser》结合强化学习和文档解析数据集的构建,并介绍了《When to use GraphRAG: A Comprehensive Analysis for Graph Retrieval-Augmented Generation》,分析了GraphRAG在不同场景下的有效性。
2025年6月10日,北京晴。本文讨论了文档解析处理中的检测问题和语义解析问题,包括布局检测、阅读顺序识别、背景干扰、ppocrv5模型精度、跨页表格合并等问题,并提出了解决方案。
2025年6月9日北京晴天,文章介绍了多模态RAG实现流程、AI Baby Monitor应用、用于语法纠错的微调模型及个人财务大模型等内容。
今天是2025年6月7日,星期六,北京晴。介绍了两个关于知识图谱本体的工作,一是RAG用于MySQL数据生成知识图谱本体的方法,二是基于非结构化知识库进行本体生成的方法。
今天是2025年6月6日,星期五,北京晴。文章回顾了大模型相关技术进展,包括针对性学习、推理数据收集、多模态应用及强化学习评估偏差等内容。关键点在于明确问题并针对性学习,学会提问和理论与实践结合,以提升大模型性能。
今天是2025年6月5日,星期四,北京晴。文章介绍了将文本编码进MP4文件的有趣RAG尝试和Agentic-doc文档处理系统。Memvid项目通过MP4索引实现快速语义搜索,而Agentic-doc则利用agent高效提取复杂文档结构化数据。
2025年5月29日,北京晴。文章介绍了大模型推理及语音模型评估进展和数据合成框架SynLogic的最新情况,包括DeepSeek-R1更新、LALM-Evaluation-Survey项目以及用于生成多样化的逻辑推理数据的SynLogic框架。
2025年5月28日,北京晴。文章探讨了从几张图看RAG及Agent的问题和基于自我置信度作为强化学习监督信号的工作,强调实际业务数据的重要性,并指出不要过度依赖Agent智能体解决问题。
2025年5月27日星期二,北京晴天。本文讨论了P2P项目如何利用智能体生成研究论文海报的思路与实现细节,并介绍了版式分析在文档搜索和推荐等下游任务中的应用潜力。