通杀主流LLM!用知识图谱“撬开”大模型安全门,黑盒越狱新范式HBS-KGLLM发布

南京航空航天大学团队提出HBS-KGLLM框架,通过增强知识图谱挖掘有害信息结构化知识,实现有效探测LLMs的安全性能。该方法成功率高、成本低,并已在多款主流模型上测试表现优异。

0%通过率!Code神话泡沫!LiveCodeBenchPro发布!

MLNLP社区是国内知名的人工智能与自然语言处理学术社群,旨在促进跨学科交流合作。近期,该团队揭穿了大模型在编程比赛中表现不佳的事实,并提出了改进方法以提升AI能力。

AI记忆伪装被戳穿!GPT、DeepSeek等17款主流大模型根本记不住数字

本文介绍了一项研究,发现大多数语言模型缺乏人类的工作记忆能力。通过三组实验测试,表明模型在猜数字、是非问答和数学魔术任务中均无法有效保留信息。