通用评估框架归档 - 每时AI

UGBench：大语言模型的“遗忘”基准测试工具

2025年5月7日8时作者 NLP工程化

UGBench是用于评估大语言模型知识遗忘问题的基准测试工具，支持3个数据领域和多种遗忘方法，使用两种不同规模的语言模型进行测试。