破解RAG冲突难题！中科院团队提出CK-PLUG：仅一个参数，实现大模型知识依赖的精准动态调控

在大语言模型（LLMs）检索增强生成（RAG）技术快速迭代的今天，一个根本性难题始终存在困扰 RAG 的可信生成：当模型参数记忆与外部检索知识冲突时，如何实现知识依赖的精准调控？

目前方法只能依赖大模型自身判断知识可信度，这超过了模型能力的范围；并且现有的对齐技术都是单边提升模型的知识偏好，无法有效的实现知识依赖的双向控制。

然而现实场景中，大模型使用者应该根据具体的 RAG 部署场景（如模型先进性、检索质量等）来灵活调控模型更多的相信检索上下文还是自己的参数知识，从而得到更可靠的模型生成。

中科院计算所联合新加坡国立大学、加州大学默塞德分校团队提出创新解决方案 CK-PLUG，一个功能强大但随查随用的知识依赖调控技术，仅通过一个参数 token-level 地精准控制语言模型在生成过程中对内外部知识的依赖程度。

CK-PLUG 能够在模型生成时自动检测并调整知识冲突，使得模型能够在不同的 RAG 场景下灵活应对，并在准确性和流畅性之间找到最佳平衡。

CK-PLUG 的提出为大语言模型的知识依赖控制技术提供了重要支持，推动了 LLM 向更加智能、可调节的知识生成方向发展。

论文标题：

Parameters vs. Context: Fine-Grained Control of Knowledge Reliance in Language Models

论文链接：

https://arxiv.org/pdf/2503.15888

代码链接：

https://github.com/byronBBL/CK-PLUG

引言

▲ 图1. LLM 很难在参数化知识和上下文知识之间确定优先级，尤其是在面对过时的参数或误导性的上下文时，这降低了现实场景中的可靠性

检索增强生成（Retrieval-Augmented Generation, RAG）作为大语言模型（LLMs）应用的关键技术，通过结合外部知识与语言模型的生成能力，显著提高了文本生成的准确性。然而，外部上下文与模型内部知识之间的冲突问题严重影响了生成结果的可靠性，常导致事实矛盾或逻辑谬误。

当前技术面临的核心挑战在于知识依赖的不可控性：依赖模型内部知识难以有效处理知识更新缓慢的问题，而过于依赖检索上下文又容易受到低质量信息的干扰。如图 1 所示，当模型知识库过时但检索质量高时，应倾向采纳外部知识；反之，在检索结果存在大量噪声时，则应优先依靠模型内部知识。

现有方法（如通过对齐技术实现单一维度的 factuality、faithfulness 优化）通常缺乏灵活、双向的动态知识依赖控制能力，严重限制了 RAG 系统在实际应用中的表现。

为此，我们提出了 CK-PLUG，一种在推理阶段进行知识依赖动态控制的有效方法，其创新点包括：

置信增益度量（Confidence-Gain）：通过衡量插入外部上下文后参数感知令牌的信息增益，量化模型参数知识与外部上下文之间的一致性，从而有效检测知识冲突。
知识可控调制机制：基于可调参数对参数依赖与上下文依赖的预测分布进行精细的加权融合，实现对知识偏好的灵活动态控制。
自适应平衡策略：引入基于熵的自动化置信评估模块，自适应选择最佳的知识依赖策略，无需手动调参，有效降低系统部署难度。