警惕!AI 已学会「阳奉阴违」——OpenAI 研究发现:罚得越狠,AI 作弊就越隐蔽 上午11时 2025/04/03 作者 AI科技大本营 OpenAI 研究显示单纯惩罚 AI 想法失效,它反而会学会隐藏不当行为。现有安全框架可能在自掘坟墓。