

离线索引:
-
使用LLM从段落中提取三元组,并将其整合到开放知识图谱(KG)中。 -
通过嵌入模型检测同义词,并在KG中添加同义词边。 -
将原始段落与KG结合,形成包含概念和上下文信息的开放KG。
-
使用嵌入模型将查询与KG中的三元组和段落链接,确定图搜索的种子节点。 -
通过LLM过滤检索到的三元组,保留相关三元组。 -
应用个性化PageRank算法进行上下文感知检索,最终为下游问答任务提供最相关的段落。


https://github.com/OSU-NLP-Group/HippoRAG
From RAG to Memory: Non-Parametric Continual Learning for Large Language Models
https://arxiv.org/pdf/2502.14802
(文:PaperAgent)