专治大模型“套壳”!上海AI实验室等给LLM做“指纹识别”,剪枝合并也无所遁形

上海AI Lab邵婧团队提出REEF方法,基于模型表征的指纹识别技术可精准检测大模型‘套壳’行为。该方法不改变模型性能,在多种操作后仍能有效识别衍生模型和无关模型。

专治大模型“套壳”!上海AI实验室等给LLM做“指纹识别”,模型剪枝、合并等也无所遁形

上海AI Lab邵婧课题组提出一种新的大模型指纹识别方法REEF(Representation Encoding Fingerprints),能够在不改变模型性能的前提下精准检测未经授权的后续开发行为,给大模型开发团队提供了一种应对大模型侵权问题的新手段。