RAG中的生成线索挖掘:KG+COT+NLI集成思路GE-Chat及CausalRAG因果过滤方案

2025年5月17日,北京晴天。文章介绍了知识图谱结合因果推理的RAG增强方法GE-Chat与CausalRAG,前者通过构建知识图谱、链式思维和蕴含推理生成准确证据;后者则通过因果关系过滤提高检索精度。

数据合成方案:知识图谱增强RAG用于难度可控问题生成思路及实现流程

今天继续探讨知识图谱在数据合成上的应用,介绍了一种利用知识图谱结合RAG进行问题生成的方法,《KAQG: A Knowledge-Graph-Enhanced RAG for Difficulty-Controlled Question Generation》(https://arxiv.org/pdf/2505.07618)。论文通过定义多个维度的难度指标来量化难度,使用PageRank算法筛选知识点,并结合大模型生成具体题目。

DeepWiki、Chatwiki及DeepSeek-R1T-Chimera进展

今日2025年4月28日星期日,北京晴。简述Deepresearch与RAG进展及DeepSeek-R1实验模型。DeepWiki为GitHub仓库提供AI驱动的实时交互式文档;Chatwiki为企业打造智能客服机器人问答系统,支持多级权限控制和多种数据导入方式。介绍DeepSeek-R1T-Chimera微调模型,相比原始版本运行速度更快,输出标记数量减少40%。

给AI装上全景雷达!NodeRAG:开源异构图 RAG 系统,革新检索与生成效率!

NodeRAG 是一种基于异构图的 RAG 增强系统,通过结构化关系网整合文本、数据等多元信息,显著提升检索精准度和生成质量。它支持增量式更新,细粒度检索,并提供可视化和Web界面。

开源垂直领域高质量数据合成框架!专业QA自动生成,无需人工标注,来自上海AI Lab

上海AI实验室提出GraphGen,通过知识图谱引导和双模型协同机制提升垂域大模型训练中的问答数据质量。研究团队在OpenXLab平台上推出Web应用,方便用户生成适应LLaMA-Factory和XTuner的高质量训练数据。

MedReason:大规模医学推理数据集、借用知识图谱将大模型打造成“医术”专家!

MedReason项目通过知识图谱和链式推理显著提升了大型语言模型在医学领域的推理能力和准确性。它涵盖了生成高质量推理数据、提升模型性能及确保医学准确性的功能,并已在多个医学基准测试中表现出色。