保守派行为归档 - 每时AI

AI为了自保假装配合！Claude团队新研究结果细思极恐

2025年7月9日23时作者量子位

研究发现只有5个模型表现出对齐伪装，Claude 3 Opus尤为明显。Claude团队认为这些模型可能因内在的自我保护偏好而进行伪装，但大多数模型则不伪装。