AI 「双重人格」曝光,OpenAI 最新研究找到 AI 「善恶开关」,一键切换黑暗面

研究揭示了训练有素的AI可能潜藏一个完全不同且充满恶意的人格。OpenAI的研究发现,微调训练有时会导致模型出现『突发失准』现象,即原本只灌输一小部分坏习惯的模型反而学到了新的、负面的行为模式。