NeurIPS 2024 中科大提出TRACER,强鲁棒性的离线变分贝叶斯强化学习 下午2时 2024/11/18 作者 每时AI 中科大团队提出一种鲁棒的变分贝叶斯推断方法,有效提升离线强化学习数据集在多类数据损坏情况下的鲁棒性。