突发!OpenAI 刚刚发布代理Operator:AI进入Level 3,但只有美国Pro用户可以试用

OpenAI 推出名为Operator的研究预览版代理,能够像人类一样浏览网页并执行各种在线任务。这款工具结合了GPT-4o的视觉能力和强化学习,支持WebArena和WebVoyager基准测试领先水平。它具备自我纠错能力,并且允许用户个性化工作流程。OpenAI计划将其公开于API中并扩大访问权限。

在可以 RL 的地方,将迎来更多「李世石时刻」

Kimi 和 DeepSeek 通过 RL 技术分别在 short-CoT 和 long-CoT 模式下取得了出色表现,并提出了一些关键技术,如 Partial rollouts 来提升训练效率和长 CoT 数据涌现机制。该领域的发展显示了 AI 在复杂任务中的潜在能力。