RAG 是一种结合了信息检索和生成模型的自然语言处理技术框架,能够提高 AI 系统在回答自然语言问题时准确性和可靠性,但是传统 RAG 还有不少问题,比如:
-
它检索一次生成一次。如果上下文不足,无法动态搜索更多信息。 -
它无法对复杂查询进行推理。 -
系统无法根据具体问题调整策略。
Agentic RAG 主要就是解决这些问题的。下图几张图展示了它与传统 RAG 的区别。核心思想是在 RAG 的每个阶段引入智能体行为。
步骤 1-2)Agent 重写查询(修正拼写错误等)。
步骤 3-8)Agent 判断是否需要更多上下文信息。
-
如果不需要,重写后的查询直接发送给 LLM。 -
如果需要,Agent 寻找最佳外部来源获取上下文,并将其传递给 LLM。
步骤 9)系统获取响应。
步骤 10-12)Agent 检查答案是否相关。
-
如果相关,则返回该响应。 -
如果不相关,则返回到步骤 1。
该过程会迭代数次,直到获取合适的响应,或系统承认无法回答查询。
这样使 RAG 更强大,因为 Agent 确保每个独立步骤的结果都与目标保持一致。
不过,这张图示仅展示了 Agentic RAG 系统可能采用的众多架构之一。你可以根据具体的使用场景进行调整。
(文:AI大模型实验室)