打王者荣耀,发NeurIPS! 下午2时 2025/03/23 作者 Datawhale 提出Hokoff数据集,首个基于《王者荣耀》的真实对战数据集用于离线强化学习和离线多智能体强化学习基准。介绍创新点:开源框架支持全流程流程,新基线算法QMIX+CQL有效处理复杂动作空间。