专治大模型“套壳”!上海AI实验室等给LLM做“指纹识别”,剪枝合并也无所遁形

上海AI Lab邵婧团队提出REEF方法,基于模型表征的指纹识别技术可精准检测大模型‘套壳’行为。该方法不改变模型性能,在多种操作后仍能有效识别衍生模型和无关模型。