NeurIPS 2024 多样任务真实数据,亚马逊提出在线购物领域评测基准Shopping MMLU
在线购物是现代生活中必不可少的组成部分。2023 年,在线购物销售额已经占到中国全部销售额的 46%
在线购物是现代生活中必不可少的组成部分。2023 年,在线购物销售额已经占到中国全部销售额的 46%
基于亚马逊真实购物数据,港科大与圣母大学联合构建了大规模评测基准Shopping MMLU,评估大语言模型在线购物领域的应用潜力。该基准覆盖多项任务及能力,强调多任务学习、少样本学习和特定领域知识理解的重要性,并且已被公开用于研究和应用。