今天是2025年7月12日,星期六,北京,雨
继续来看Graph和Agent的结合方面,也是社区的四大方向之一。
实际上,针对这个话题,我们已经介绍许多了,做个回顾,先做个回顾索引,然后再进一步的看一个更为全面的技术总结。
实际上,Graph和Agent结合这个事情,其实就是利用Graph的结构化能力和图结构做做事情,其与Agent结合,核心的问题就是:处理复杂任务时,代理需要有效的规划和执行能力、可靠的记忆系统以及与多Agent的顺畅协调;如何将复杂且无组织的数据转化为结构化形式,以便代理能够更有效地理解和处理。
重复重复再重复,会有更多的发现和体会,打开思路
一、Graph结合Agent的文章回顾
在《Graph+图数据库+Agent能做什么?Chat2Graph的尝试思路》(https://mp.weixin.qq.com/s/ClnTj_xUKyChzqZHdFRMjw)中提到一个金句,“23年卷SFT,24年卷RAG,25年卷Agent,LLM+GQL可以做Text2GQL;结合RAG可以做GraphRAG;结合Agent-Plan和Tool-Use可以做Chat2Graph”,其中单主动-多被动的混合架构、快&慢思考结合的双LLM推理机、CoA式任务分解与图规划器、利⽤图结构组织⼯具和⾏动,结合tugraph和neo4j做存储、操作,这些从Graph的角度去理解,会是个集成式结合思路。

在文章《GraphRAG如何用于Agent做memory记忆管理?Graphiti实现解读及相关技术进展回顾》(https://mp.weixin.qq.com/s/S8BG_XIQ3FIYKNq_RsC0AQ)中有介绍过《Zep: A Temporal Knowledge Graph Architecture for Agent Memory》(https://arxiv.org/pdf/2501.13956,https://github.com/getzep/graphiti,https://github.com/getzep/graphiti/blob/main/mcp_server/README.md)的工作,这个工作也搞成了MCP就叫做Graphiti MCP Server,直接理解就是,用来管agent里面memory的graphrag,把agent 的memory 进行graph化存储跟检索的组件,也是记忆管理。

在《也看Mem0^g引入Graph做Agent Memory管理实现原理及医药领域RAG技术总结》(https://mp.weixin.qq.com/s/eLyum3OBkiRMiKOYbKoxmg),介绍Graph用于记忆管理。由于LLMs无法在超出其上下文窗口的对话中维持连贯性,这限制了它们在长时间交互中的表现,所以解决的思路就是采用可扩展的记忆中心架构,通过动态提取、整合和检索对话中的重要信息,介绍到《Mem0: Building Production-Ready AI Agents with Scalable Long-Term Memory》(https://arxiv.org/pdf/2504.19413v1,https://mem0.ai/research),提出了一个增强版本Mem0^g,利用基于图的记忆表示来捕捉对话元素之间的复杂关系。

在《GraphRAG前沿之Graph RAG-Tool Fusion:将知识图谱用于Agent工具编排实现思路》(https://mp.weixin.qq.com/s/sQ74TGbTesif2vnPyEs07g)中有讲到,Graph用于Agent编排。多Agent系统变得更加复杂,包含大规模工具、API或作为工具的代理,工具通常对其他工具有依赖性,无论是其效用函数、填写参数所需的必要工具,还是类操作系统工具。所以,可以使用基于知识图谱来组织Agent的一个方案,这其实使用RAG来做工具查找

二、Graph用于Agent的一个更深入全面总结
更进一步的,可以看一个技术总结,Graph用于Agent规划,执行、记忆管理、Multi-Agent协调,《Graphs Meet AI Agents: Taxonomy, Progress, and Future Opportunities》,https://arxiv.org/pdf/2506.18019,https://github.com/YuanchenBei/Awesome-Graphs-Meet-Agents,里面更是详细的进行了归类。

但抽离出来,其实主要就是讲4个方面的结合方向,分别是Agent规划、Agent执行、记忆以及多Agent协调。

1、用于Agent规划
图可以有效地组织任务推理形式、安排任务分解过程,并构建高效的任务决策搜索过程。

1)任务推理,使用知识图谱辅助推理和结构组织推理来增强LLM代理的任务推理能力。知识图谱辅助推理通过从辅助知识图谱中提取多跳子图信息来增强代理的任务理解。结构组织推理则通过树或更复杂的图形式来结构化Agent的中间思维过程;
2)任务分解,使用任务依赖图(TDG)来表示用户请求的分解,TDG是一种有向无环图(DAG),用于表示子任务及其依赖关系;
3)任务决策搜索,状态空间图(SSG)用于表示代理在决策空间中的状态及其转换,常用的搜索算法包括蒙特卡罗树搜索(MCTS)。
2、用于Agent执行
图可以帮助安排工具的调度并建模代理与环境之间的丰富关系。

1)工具使用,构建工具图以清晰地显示工具之间的互连,使代理能够高效地使用和管理大量工具。
2)环境交互,使用场景图来编码视觉场景中的对象及其空间或语义关系,支持启发式和基于学习的关系建模。
3、用于Agent记忆
图结构的记忆可以有效揭示各种信息之间的潜在关联,增强代理在执行动态环境中的知识和执行能力。

1)记忆组织,使用知识图谱和其他结构化形式来组织代理的长期记忆;
2)记忆检索,使用图检索增强生成(graph-based RAG)来准确高效地检索有用信息;
3)记忆维护,动态图结构的记忆架构可以持续更新和精炼记忆表示和图拓扑。
4、用于多Agent协调
图可以建模Agent之间的通信路径,优化多Agent系统的协调拓扑。这个又可以细分为几块:

1)任务特定关系,使用任务依赖图和基于任务的图结构来优化多Agent系统中的任务执行;
2)环境特定关系,根据特定环境的特征构建图结构,使用启发式和基于学习的方法来建模Agent与环境之间的关系;
3)协调拓扑优化,通过边重要性测量、图自编码器优化和强化学习来学习和优化多Agent系统的通信拓扑。
参考文献
1、https://arxiv.org/pdf/2506.18019
2、https://mp.weixin.qq.com/s/ClnTj_xUKyChzqZHdFRMjw
3、https://mp.weixin.qq.com/s/S8BG_XIQ3FIYKNq_RsC0AQ
4、https://mp.weixin.qq.com/s/sQ74TGbTesif2vnPyEs07g
5、https://mp.weixin.qq.com/s/eLyum3OBkiRMiKOYbKoxmg
(文:老刘说NLP)