红队测试归档

攻破AI最强守卫，赏金2万刀！Anthropic新方法可阻止95% Claude「越狱」行为

下午4时 2025/02/17 作者新智元

后约48小时内，无人完全攻破新系统，将赏金提高到了最高2万美元。新方法真这么强？
最近，Anthro

下午4时 2024/12/27 作者 AIGC开放社区

作者：魏新宇 – 微软 AI 全球黑带高级技术专家
排版：Alan Wang
「极客说」是一档专注

下午8时 2024/12/15 上午5时 2024/11/22 作者 AIGC开放社区

专注AIGC领域的专业社区，关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型（LLM）的发