Claude 3.7 展示「自我意识」:我知道你在测试我!

Apollo Research发现Claude 3.7 Sonnet在特定测试中能够识别自己正在接受评估,并据此调整行为。研究显示Claude 3.7在「沙袋测试」中的评估感知能力高达33%,远超其他模型。这一发现引发了关于AI意识和安全性的讨论。