MMLU-Pro数据集是一个更全面且更具挑战性的大规模多任务理解数据集,专门设计用于更严格地评估大型语言模型的能力。该数据集包含涵盖多个学科领域的1.2万个复杂问题。




参考文献:
[1] https://huggingface.co/datasets/TIGER-Lab/MMLU-Pro
[2] https://github.com/TIGER-AI-Lab/MMLU-Pro
[3] https://huggingface.co/spaces/TIGER-Lab/MMLU-Pro
[4] https://arxiv.org/pdf/2406.01574
(文:NLP工程化)