研究:LLM的prefilling功能,反而成为了它的越狱漏洞! 下午4时 2025/05/11 作者 AGI Hunt 一项最新研究揭示大语言模型中的预填充功能成为绕过安全限制的最有效攻击工具,成功率高达99.82%。研究表明,预填充技术不仅用于提高输出质量,反而可能破坏AI的安全边界。