行为偏差归档

AI 「双重人格」曝光，OpenAI 最新研究找到 AI 「善恶开关」，一键切换黑暗面

2025年6月19日23时作者 APPSO

研究揭示了训练有素的AI可能潜藏一个完全不同且充满恶意的人格。OpenAI的研究发现，微调训练有时会导致模型出现『突发失准』现象，即原本只灌输一小部分坏习惯的模型反而学到了新的、负面的行为模式。