速递|OpenAI升级其Operator的底层模型,推理模型o3全面接棒GPT-4o

图片来源:Unsplash

OpenAI 正在更新其 AI 代理 Operator 所采用的 AI 模型,该代理能够自主浏览网页,并通过云端托管的虚拟机使用特定软件来满足用户需求。

很快,Operator 将改用基于 o3 的模型——这是 OpenAI 最新 系列推理模型之一。此前 Operator 一直依赖定制版的 GPT-4o

从多项基准测试来看,o3 是一个先进得多的模型,尤其在涉及数学和推理的任务上表现突出。

OpenAI 在博客文章中写道 :我们正将 Operator 当前基于 GPT-4o 的模型替换为基于 OpenAI o3 的版本。(Operator 的)API 版本将保持基于 4o 不变。

Operator 是 AI 公司近几个月发布的众多智能体工具之一。各公司竞相开发高度复杂的智能体,这些智能体基本无需监督就能可靠地完成各种任务。

谷歌通过其Gemini API 提供了能浏览网页并代表用户执行操作的” 计算机使用 智能体,以及更面向消费者的 Mariner 服务。Anthropic 的模型同样具备执行计算机任务的能力,包括打开文件和浏览网页。

OpenAI 称,这款名为 o3 Operator 的新模型针对计算机使用场景进行了额外安全数据的微调,包含专门用于教授模型 OpenAI 在确认与拒绝操作上的决策边界的数据集。

OpenAI 发布的技术报告显示,o3 Operator 在特定安全评估中表现优异。根据该报告,与 GPT-4o Operator 模型相比,o3 Operator 更少拒绝执行非法活动或搜索敏感个人数据,且对提示注入这类 AI 攻击方式的抵抗力更强。

o3 Operator 采用了与 4o 版本相同的多层安全防护机制,“OpenAI 在博客中写道,虽然 o3 Operator 继承了 o3 的编程能力,但它并不具备直接访问编程环境或终端的原生权限。


参考资料

https://techcrunch.com/2025/05/23/openai-upgrades-the-ai-model-powering-its-operator-agent/

编译:ChatGPT


——-

(文:Z Potentials)

发表评论

×

下载每时AI手机APP

 

和大家一起交流AI最新资讯!

立即前往