AI 彻底摆脱人类!Anthropic让模型自己微调自己,左脚踩右脚要上天……

AI学会了自我打分和学习,实现自我提升。Anthropic的研究人员提出ICM技术,让模型通过评估自己的答案来改进能力,并在多项任务上超过了黄金标准标注的模型,甚至击败了人类监督版本。