OpenAI最强模型惨遭剖脑,CoT写下作弊自白书!不写代码耍心机被当场抓包 下午4时 2025/03/11 作者 新智元 八门,比如放弃认真写代码,开始费劲心思钻系统漏洞!为此,OpenAI研究者开启了「CoT监控」大法,
离职OpenAI后Lilian Weng博客首发!深扒RL训练漏洞,业内狂赞 上午6时 2024/12/06 作者 新智元 新智元报道 编辑:静音 泽正 【新智元导读】 Lilian Weng离职OpenAI后首篇博客发布!
离职OpenAI后,翁荔博客首次上新,引众网友围观学习(中文全文) 下午7时 2024/12/02 作者 机器之心 机器之心报道 机器之心编辑部 大约一个月前,OpenAI 安全系统团队负责人翁荔(Lilian We