ASSEBench 归档 - 每时AI

AgentAuditor: 让智能体安全评估器的精确度达到人类水平

2025年6月27日16时作者机器之心

LLM 智能体自主决策能力提升带来安全性评估难题，研究者提出 AgentAuditor 解决方案，显著提升 LLM 评估器精确度至人类水平。