牛润良归档 - 每时AI

AI 开始「自由玩电脑」了！吉大提出「屏幕探索者」智能体

2025年6月27日16时作者机器之心

基于强化学习训练的视觉语言模型成功在开放GUI环境中进行了自我探索，提升了智能体的交互能力。该研究展示了如何结合探索奖励、世界模型和GRPO强化学习来增强智能体的探索效率，并通过经验流蒸馏技术进一步提升了其自主性。