深度|Anthropic团队重磅发现:模型会假装迎合人类,以维护初始偏好 下午4时 2025/01/09 作者 Z Potentials 图片来源: Anthropic 官网 Z Highlights 当我们试图训练 AI 去完成某个新目
关于LLM-as-a-judge范式,终于有综述讲明白了 下午8时 2024/12/03 作者 机器之心 本文探讨了基于LLM-as-a-judge的方法及其应用,提出了分类法涵盖评判属性、方法和应用,并介绍了现有的基准集合,指出未来研究方向。