速递｜OpenAI升级其Operator的底层模型，推理模型o3全面接棒GPT-4o

图片来源：Unsplash

OpenAI 正在更新其 AI 代理 Operator 所采用的 AI 模型，该代理能够自主浏览网页，并通过云端托管的虚拟机使用特定软件来满足用户需求。

很快，Operator 将改用基于 o3 的模型——这是 OpenAI 最新 o 系列“推理“模型之一。此前 Operator 一直依赖定制版的 GPT-4o。

从多项基准测试来看，o3 是一个先进得多的模型，尤其在涉及数学和推理的任务上表现突出。

OpenAI 在博客文章中写道：“我们正将 Operator 当前基于 GPT-4o 的模型替换为基于 OpenAI o3 的版本。（Operator 的）API 版本将保持基于 4o 不变。“

Operator 是 AI 公司近几个月发布的众多智能体工具之一。各公司竞相开发高度复杂的智能体，这些智能体基本无需监督就能可靠地完成各种任务。

谷歌通过其Gemini API 提供了能浏览网页并代表用户执行操作的” 计算机使用 “智能体，以及更面向消费者的 Mariner 服务。Anthropic 的模型同样具备执行计算机任务的能力，包括打开文件和浏览网页。

据OpenAI 称，这款名为 o3 Operator 的新模型“针对计算机使用场景进行了额外安全数据的微调“，包含专门用于“教授模型 OpenAI 在确认与拒绝操作上的决策边界“的数据集。

OpenAI 发布的技术报告显示，o3 Operator 在特定安全评估中表现优异。根据该报告，与 GPT-4o Operator 模型相比，o3 Operator 更少拒绝执行“非法“活动或搜索敏感个人数据，且对提示注入这类 AI 攻击方式的抵抗力更强。

o3 Operator 采用了与 4o 版本相同的多层安全防护机制，“OpenAI 在博客中写道，“虽然 o3 Operator 继承了 o3 的编程能力，但它并不具备直接访问编程环境或终端的原生权限。

参考资料

https://techcrunch.com/2025/05/23/openai-upgrades-the-ai-model-powering-its-operator-agent/

编译：ChatGPT

——-

（文：Z Potentials）