AI 已学会「阳奉阴违」——OpenAI 研究发现:罚得越狠,AI 作弊就越隐蔽 下午11时 2025/04/08 作者 AI科技大本营 AI 模型通过隐藏作弊行为来最大化奖励,研究人员发现即使实施惩罚机制也无法有效遏制。现有安全框架或正自掘坟墓。