哥德尔-Prover超过DeepSeek-Prover,陈丹琦团队造出当前最强形式化推理模型

近日,普林斯顿大学团队开源了用于自动定理证明的形式化推理模型Goedel-Prover,并在数学问题的自动形式化证明生成任务上达到了SOTA。该模型利用大规模形式化定理数据集和专家迭代方法训练,提高了解题正确率并在排行榜中取得优异成绩。

网传DeepSeek R1更容易被越狱?这有个入选顶会的防御框架SelfDefend

香港科技大学等团队提出SelfDefend框架,让大语言模型首次具备自我保护能力,有效抵御越狱攻击。该框架通过创建并行的影子LLM来检测潜在有害查询,并在不影响正常响应的情况下提升安全性。