一次搞定自驾场景的可控生成和长时序生成?科大和地平线提出DrivingWorld:基于视频GPT构建自动驾驶世界模型
DrivingWorld模型通过创新的空间-时间解耦机制和高效的编码解码模块,实现了自动驾驶场景的可控生成和超长时间视频生成。该研究由香港科技大学与地平线联合完成,论文、代码均开放获取。
DrivingWorld模型通过创新的空间-时间解耦机制和高效的编码解码模块,实现了自动驾驶场景的可控生成和超长时间视频生成。该研究由香港科技大学与地平线联合完成,论文、代码均开放获取。
基于亚马逊真实购物数据,港科大与圣母大学联合构建了大规模评测基准Shopping MMLU,评估大语言模型在线购物领域的应用潜力。该基准覆盖多项任务及能力,强调多任务学习、少样本学习和特定领域知识理解的重要性,并且已被公开用于研究和应用。