老刘归档 - 第3页共8页 - 每时AI

三种主流文本嵌入编码范式及KG-Infused RAG做问题扩展新思路

2025年6月13日14时作者老刘说NLP

今天是2025年6月13日，星期五，北京晴天。文章介绍了三种embedding编码范式（Bi-encoders、Cross-encoder、ColBERT）及其对比，并探讨了知识图谱与RAG结合在问答系统中的应用，重点介绍《KG-Infused RAG: Augmenting Corpus-Based RAG with External Knowledge Graphs》的研究工作及其步骤。

如何用大模型自动生成PPT？AutoPresent及SlideCoder方案

2025年6月12日14时作者老刘说NLP

今天是2025年6月12日，星期四，北京晴。文章介绍了两种PPT生成方案AutoPresent和SlideCoder，前者通过微调LLAMA模型生成Python代码，后者使用布局感知的检索增强生成框架，包含层次化检索增强生成、图像分割等技术。

GraphRAG的优劣势及文档解析结合RL强化学习新思路Infinity Parser

2025年6月11日14时作者老刘说NLP

在2025年6月11日的文章中，探讨了《Infinity Parser》结合强化学习和文档解析数据集的构建，并介绍了《When to use GraphRAG: A Comprehensive Analysis for Graph Retrieval-Augmented Generation》，分析了GraphRAG在不同场景下的有效性。

真实场景下文档解析中的2大类8个常见问题：目录层级解析、布局检测、阅读顺序及长表格拼接

2025年6月10日14时作者老刘说NLP

2025年6月10日，北京晴。本文讨论了文档解析处理中的检测问题和语义解析问题，包括布局检测、阅读顺序识别、背景干扰、ppocrv5模型精度、跨页表格合并等问题，并提出了解决方案。

大模型应用推介：多模态RAG、语法纠错、个人财务及Baby Monitor

2025年6月9日14时作者老刘说NLP

2025年6月9日北京晴天，文章介绍了多模态RAG实现流程、AI Baby Monitor应用、用于语法纠错的微调模型及个人财务大模型等内容。

再看知识图谱本体生成：RAG用于Mysql数据转换及非结构化文本生成思路

2025年6月7日14时作者老刘说NLP

今天是2025年6月7日，星期六，北京晴。介绍了两个关于知识图谱本体的工作，一是RAG用于MySQL数据生成知识图谱本体的方法，二是基于非结构化知识库进行本体生成的方法。

强化学习数据合成框架SynLogic及语音大模大模型评估

2025年5月30日14时作者老刘说NLP

2025年5月29日，北京晴。文章介绍了大模型推理及语音模型评估进展和数据合成框架SynLogic的最新情况，包括DeepSeek-R1更新、LALM-Evaluation-Survey项目以及用于生成多样化的逻辑推理数据的SynLogic框架。

RAG和Agent的几张趣图思考及RLI基于自我置信度RL强化学习思路

2025年5月28日19时作者老刘说NLP

2025年5月28日，北京晴。文章探讨了从几张图看RAG及Agent的问题和基于自我置信度作为强化学习监督信号的工作，强调实际业务数据的重要性，并指出不要过度依赖Agent智能体解决问题。

如何用Agent智能体生成论文poster海报？文档版式分析还能用来做什么？

2025年5月27日14时作者老刘说NLP

2025年5月27日星期二，北京晴天。本文讨论了P2P项目如何利用智能体生成研究论文海报的思路与实现细节，并介绍了版式分析在文档搜索和推荐等下游任务中的应用潜力。

通俗易懂看技术：24张流程图直观理解LLM、RAG及Agent

2025年5月25日14时作者老刘说NLP

2025年5月24日周六，北京晴天。本文总结了大模型微调与训练、RAG及AgenticRAG等7张图，以及Agent、MCP和Functioncall的9张图。这些内容可供参考并作为验证标准，有助于深度思考和体系化学习。