开源模型竟被用于窃取下游微调数据?清华团队揭秘开源微调范式新型隐藏安全风险
清华大学与墨尔本大学团队揭示了开源大模型微调过程中隐藏的安全风险,通过后门注入技术秘密窃取下游私有数据。该研究指出攻击者可从5000条微调数据中恢复接近4000条完整查询。
清华大学与墨尔本大学团队揭示了开源大模型微调过程中隐藏的安全风险,通过后门注入技术秘密窃取下游私有数据。该研究指出攻击者可从5000条微调数据中恢复接近4000条完整查询。
一种名为HtmlRAG的新方法让RAG系统能够充分利用HTML结构信息,大幅提升知识检索准确性。通过HTML清理、块树构建及两阶段剪枝技术,HtmlRAG解决了传统RAG系统的「近视」问题,显著提高了效率和准确性。