AI 开始「自由玩电脑」了!吉大提出「屏幕探索者」智能体 2025年6月27日16时 作者 机器之心 基于强化学习训练的视觉语言模型成功在开放GUI环境中进行了自我探索,提升了智能体的交互能力。该研究展示了如何结合探索奖励、世界模型和GRPO强化学习来增强智能体的探索效率,并通过经验流蒸馏技术进一步提升了其自主性。