提出机器人自主学习新范式,深大团队最新顶会论文,刷新6大复杂任务SOTA

深圳大学李坚强教授团队联合鹏城国家实验室、北京理工大学莫斯科大学提出奖励函数与策略协同进化框架ROSKA,该框架显著提升机器人多自由度任务的学习性能,仅使用89%训练样本即可平均提升95.3%,在多个复杂任务中实现突破。