OpenAI 终于更新了!
OpenAI 更新了,但不是 GPT-5
。
这次更新的是一个名为 ChatGPT Agent
的新功能。
顾名思义,OpenAI 的野心是让 ChatGPT 不再只是一个“陪聊型 AI”,而是真正进化为一个“会动手”的 AI Agent(智能体)。
所以,在 Agent 模式的加持下,ChatGPT 现在能主动浏览网页、运行代码、点击按钮,还能帮你做 PPT、写报告、下单购物、改表格,甚至能独立完成一整套调研分析或会议筹备流程。

01|什么是 ChatGPT Agent?
一句话总结:这是一个可以“主动干活”的 ChatGPT。
过去的 ChatGPT,能写文章、答题、解读论文,但真碰到需要动手的任务,比如“打开一个网页、筛选内容、把图表复制进 PPT,再发到邮箱” —— 就只能靠你自己完成。
现在不一样了。
ChatGPT Agent 内置了自己的“云电脑”,能自动:
-
打开网页、点击按钮、浏览内容;
-
登录网站(在你的授权下);
-
运行代码、爬数据、处理文件;
-
编辑 Excel 表格、生成 PPT;
-
分析你的待办事项,写会议总结。

不仅能“理解你的任务”,而且真的能“完成任务”。而且全过程,它都会保持上下文,知道自己正在干什么、进度如何、要不要等你确认下一步。
这是一次从“被动响应”到“主动执行”的能力跃迁。
02|ChatGPT Agent 背后的“大脑”
ChatGPT Agent = Operator + Deep Research + ChatGPT
OpenAI 把此前发布的三个系统结合在了一起,才诞生了这次的 ChatGPT Agent。
-
Operator 模块:直接操作浏览器,在网页上“点击/输入/操作”;
-
Deep Research:进行深入、多源的资料收集与信息提炼,生成深度研究报告;
-
ChatGPT 本体:语言表达、逻辑推理,懂上下文。
集三家之长的 ChatGPT Agent,就像一个全能的 AI 打工人,在自己的虚拟电脑上一边思考、一边执行,从理解任务到动手完成,全流程打通。
03|ChatGPT Agent 到底能干什么?
OpenAI 给 ChatGPT Agent 配备了一个“工具箱”。
-
视觉浏览器:打开网页、点击按钮、筛选内容、填写表单,就像你在操作浏览器一样;
-
文本浏览器:用来阅读长网页、提取有价值信息,适合走“文字理解”这条路;
-
终端 Terminal:执行代码、处理数据、运行脚本,甚至安装依赖、清洗数据集;
-
连接器 Connectors:连接 Gmail、日历、Github 等账户,读取实时上下文并用于任务推理;
-
文件编辑:生成、修改 Excel 表格、PPT,支持公式、图表、结构逻辑等内容输出。
更关键的是,你不用一个个去调这些工具。你只要一句话说出你要什么,ChatGPT Agent 自己会规划流程、调用合适的工具来完成任务。

比如你说:“做一份竞对分析报告,附上图表和市场份额变化。”
ChatGPT Agent 会自己查网页、拉数据、做分析、整理图表、汇总成一份报告,最后打包发给你。
用官方的话说,这就是 Agent 模式的核心特征:
从“对话式 AI”进化为“任务型 AI”,不再只是语言理解,而是具备了“动手解决复杂任务”的能力。
04|ChatGPT Agent 技术指标
ChatGPT Agent 听起来很厉害,但真的靠谱吗?
从 OpenAI 官方公布的多项基准测试结果来看,ChatGPT Agent 的表现已经逼近甚至超越了人类专业水平。
比如经典的人类最后一场考试 HLE,ChatGPT Agent 以 41.6% 的准确率碾压了 Deep Research(26.6%)。

在评估网页浏览能力的 WebArena 基准测试中,ChatGPT Agent 准确率 65.4%,比上代 Operator 模型小有提升,已逐渐接近人类平均水平(78.2%)。

而在数据分析和建模的评估 DSBench 中,ChatGPT Agent 更是以 89.9%/85.5% 的正确率超过了人类平均水平。

05|ChatGPT Agent 安全吗?
对于这种有“自主能力”的 Agent,安全性是绕不开的话题。
OpenAI 表示这次在 ChatGPT Agent 上,重点强化了三类安全机制。
-
权限明确:凡是涉及付款、发送邮件、提交等有“现实后果”的操作,Agent 都会暂停并请求确认,不会擅自执行。
-
浏览器接管模式:可以让它登录网站帮你查资料,但密码永远只能你自己输,它看不到、也不会记录这些信息。浏览记录、Cookie 都可一键清除。
-
防提示词注入攻击:Agent 能识别并拦截网页中隐藏的“恶意提示词”(比如诱导它发起敏感请求),必要时会中断任务并提示人工介入。
此外,OpenAI 还为 ChatGPT Agent 模式启用了最高等级的生物/化学安全审查机制,防止它被用于生成危险实验或工具指令。
Agent 很强,但不能“擅作主张”;它能做事,但不会越界。始终需要人类主导, AI 只是执行者。
06|ChatGPT Agent 怎么用?
总结一下大家比较关心的谁能用,以及额度的问题。
目前,ChatGPT Agent 正在逐步开放。OpenAI 延续了一贯的调性,优先对付费用户开放,付得越多越优先。所以,ChatGPT Pro 用户即日起可用,每月 400 条消息额度。
Plus 和 Team 用户将会在未来几天内陆续开放,每月 40 条消息额度。企业与教育版预计数周内上线。
使用方式也很简单:在 ChatGPT 页面右上角点击 Tools
-> 选择 Agent
,即可开启 Agent 代理模式。

结语
年初,我们说 2025 是 “AI Agent” 爆发之年。
但实际上,各大 AI 厂商也都是在摸着石头过河。
OpenAI 这次推出的 ChatGPT Agent,严格来说是目前离“通用 AI 助理”最近的一步。
它不再只是回答问题,而是真正能理解你的需求、主动拆解步骤、自己动手执行的智能体。并且全程透明、可控。
某种意义上,这是AI 从“陪聊”向“生产力工具”跨越的必经之路。
未来还会不断变化,但可以确定的是,我们和 AI 的关系,正在快速从“对话”,变成“协作”。
你不再只是使用 AI,而是开始真正和 AI 一起工作了。
我是木易,一个专注AI领域的技术产品经理,国内Top2本科+美国Top10 CS硕士。
相信AI是普通人的“外挂”,致力于分享AI全维度知识。这里有最新的AI科普、工具测评、效率秘籍与行业洞察。
欢迎关注“AI信息Gap”,用AI为你的未来加速。
(文:AI信息Gap)