OpenAI 深夜炸场！ChatGPT Agent 上线：能帮你做 PPT、改表格、写报告了！

OpenAI 终于更新了！

OpenAI 更新了，但不是 GPT-5。

这次更新的是一个名为 ChatGPT Agent 的新功能。

顾名思义，OpenAI 的野心是让 ChatGPT 不再只是一个“陪聊型 AI”，而是真正进化为一个“会动手”的 AI Agent（智能体）。

所以，在 Agent 模式的加持下，ChatGPT 现在能主动浏览网页、运行代码、点击按钮，还能帮你做 PPT、写报告、下单购物、改表格，甚至能独立完成一整套调研分析或会议筹备流程。

01｜什么是 ChatGPT Agent？

一句话总结：这是一个可以“主动干活”的 ChatGPT。

过去的 ChatGPT，能写文章、答题、解读论文，但真碰到需要动手的任务，比如“打开一个网页、筛选内容、把图表复制进 PPT，再发到邮箱” —— 就只能靠你自己完成。

现在不一样了。

ChatGPT Agent 内置了自己的“云电脑”，能自动：

打开网页、点击按钮、浏览内容；
登录网站（在你的授权下）；
运行代码、爬数据、处理文件；
编辑 Excel 表格、生成 PPT；
分析你的待办事项，写会议总结。

不仅能“理解你的任务”，而且真的能“完成任务”。而且全过程，它都会保持上下文，知道自己正在干什么、进度如何、要不要等你确认下一步。

这是一次从“被动响应”到“主动执行”的能力跃迁。

02｜ChatGPT Agent 背后的“大脑”

ChatGPT Agent = Operator + Deep Research + ChatGPT

OpenAI 把此前发布的三个系统结合在了一起，才诞生了这次的 ChatGPT Agent。

Operator 模块：直接操作浏览器，在网页上“点击/输入/操作”；
Deep Research：进行深入、多源的资料收集与信息提炼，生成深度研究报告；
ChatGPT 本体：语言表达、逻辑推理，懂上下文。

集三家之长的 ChatGPT Agent，就像一个全能的 AI 打工人，在自己的虚拟电脑上一边思考、一边执行，从理解任务到动手完成，全流程打通。

03｜ChatGPT Agent 到底能干什么？

OpenAI 给 ChatGPT Agent 配备了一个“工具箱”。

视觉浏览器：打开网页、点击按钮、筛选内容、填写表单，就像你在操作浏览器一样；
文本浏览器：用来阅读长网页、提取有价值信息，适合走“文字理解”这条路；
终端 Terminal：执行代码、处理数据、运行脚本，甚至安装依赖、清洗数据集；
连接器 Connectors：连接 Gmail、日历、Github 等账户，读取实时上下文并用于任务推理；
文件编辑：生成、修改 Excel 表格、PPT，支持公式、图表、结构逻辑等内容输出。

更关键的是，你不用一个个去调这些工具。你只要一句话说出你要什么，ChatGPT Agent 自己会规划流程、调用合适的工具来完成任务。

比如你说：“做一份竞对分析报告，附上图表和市场份额变化。”

ChatGPT Agent 会自己查网页、拉数据、做分析、整理图表、汇总成一份报告，最后打包发给你。

用官方的话说，这就是 Agent 模式的核心特征：

从“对话式 AI”进化为“任务型 AI”，不再只是语言理解，而是具备了“动手解决复杂任务”的能力。

04｜ChatGPT Agent 技术指标

ChatGPT Agent 听起来很厉害，但真的靠谱吗？

从 OpenAI 官方公布的多项基准测试结果来看，ChatGPT Agent 的表现已经逼近甚至超越了人类专业水平。

比如经典的人类最后一场考试 HLE，ChatGPT Agent 以 41.6% 的准确率碾压了 Deep Research（26.6%）。

在评估网页浏览能力的 WebArena 基准测试中，ChatGPT Agent 准确率 65.4%，比上代 Operator 模型小有提升，已逐渐接近人类平均水平（78.2%）。

而在数据分析和建模的评估 DSBench 中，ChatGPT Agent 更是以 89.9%/85.5% 的正确率超过了人类平均水平。

05｜ChatGPT Agent 安全吗？

对于这种有“自主能力”的 Agent，安全性是绕不开的话题。

OpenAI 表示这次在 ChatGPT Agent 上，重点强化了三类安全机制。

权限明确：凡是涉及付款、发送邮件、提交等有“现实后果”的操作，Agent 都会暂停并请求确认，不会擅自执行。
浏览器接管模式：可以让它登录网站帮你查资料，但密码永远只能你自己输，它看不到、也不会记录这些信息。浏览记录、Cookie 都可一键清除。
防提示词注入攻击：Agent 能识别并拦截网页中隐藏的“恶意提示词”（比如诱导它发起敏感请求），必要时会中断任务并提示人工介入。

此外，OpenAI 还为 ChatGPT Agent 模式启用了最高等级的生物/化学安全审查机制，防止它被用于生成危险实验或工具指令。

Agent 很强，但不能“擅作主张”；它能做事，但不会越界。始终需要人类主导， AI 只是执行者。

06｜ChatGPT Agent 怎么用？

总结一下大家比较关心的谁能用，以及额度的问题。

目前，ChatGPT Agent 正在逐步开放。OpenAI 延续了一贯的调性，优先对付费用户开放，付得越多越优先。所以，ChatGPT Pro 用户即日起可用，每月 400 条消息额度。

Plus 和 Team 用户将会在未来几天内陆续开放，每月 40 条消息额度。企业与教育版预计数周内上线。

使用方式也很简单：在 ChatGPT 页面右上角点击 Tools -> 选择 Agent，即可开启 Agent 代理模式。

结语

年初，我们说 2025 是 “AI Agent” 爆发之年。

但实际上，各大 AI 厂商也都是在摸着石头过河。

OpenAI 这次推出的 ChatGPT Agent，严格来说是目前离“通用 AI 助理”最近的一步。

它不再只是回答问题，而是真正能理解你的需求、主动拆解步骤、自己动手执行的智能体。并且全程透明、可控。

某种意义上，这是AI 从“陪聊”向“生产力工具”跨越的必经之路。

未来还会不断变化，但可以确定的是，我们和 AI 的关系，正在快速从“对话”，变成“协作”。

你不再只是使用 AI，而是开始真正和 AI 一起工作了。

我是木易，一个专注AI领域的技术产品经理，国内Top2本科+美国Top10 CS硕士。

相信AI是普通人的“外挂”，致力于分享AI全维度知识。这里有最新的AI科普、工具测评、效率秘籍与行业洞察。

欢迎关注“AI信息Gap”，用AI为你的未来加速。

（文：AI信息Gap）

一	二	三	四	五	六	日
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30	31