UI-R1仅136张截图,vivo开源DeepSeek R1式强化学习,提升GUI智能体动作预测

本文介绍了一种基于规则的强化学习(RL/RFT)在GUI智能体领域的应用,UI-R1模型通过精心设计的奖励函数和高效的数据筛选策略提升了跨领域的任务表现。