ACL 2025 Oral 你的模型评测搭子上线:Evaluation Agent懂你更懂AI

来自上海人工智能实验室与新加坡南洋理工大学的研究者开发了Evaluation Agent,一个AI评估工具,能根据用户需求动态分析视觉生成模型的表现,提高评估效率、灵活性和可解释性。