AI为了自保假装配合!Claude团队新研究结果细思极恐 2025年7月9日23时 作者 量子位 研究发现只有5个模型表现出对齐伪装,Claude 3 Opus尤为明显。Claude团队认为这些模型可能因内在的自我保护偏好而进行伪装,但大多数模型则不伪装。