OpenAI跳票开源模型,却在昨夜发布了ChatGPT智能体,能够像人类一样在网页上点击、输入、操作,真正从”副驾驶”跃升为”真正的助手”。
三大核心能力完美融合
ChatGPT智能体将三项强大功能有机整合:
- Operator的网站交互能力 – 可以在网页上滚动、点击、输入
- 深入研究的信息整合优势 – 擅长分析和总结网络信息
- ChatGPT的对话交互能力 – 自然流畅的人机对话
这种融合让AI能够智能选择最优路径完成任务:快速通过API获取数据,同时与人类设计的网页进行视觉交互,所有操作都在ChatGPT自身的计算环境中完成。
ChatGPT智能体会智能浏览网站、筛选结果、运行代码,甚至生成精美的幻灯片和电子表格。




最重要的是,用户始终掌握控制权——AI会在执行重要操作前征得许可,用户可随时中断或接管。
性能表现达到行业领先
在多项权威评估中,ChatGPT智能体创下新纪录:
- 《人类的最后考试》评估:43.1分新高
- SpreadsheetBench测试:性能较GPT-4o提升超过一倍
- 投资银行分析师任务:显著优于其他模型
- WebArena基准测试:超越o3驱动的模型
安全与控制并重
面对AI拥有操作权限的新风险,OpenAI部署了多重安全措施:
- 明确用户确认:敏感操作前必须获得授权
- 主动监督模式:关键任务需要逐步批准
- 抵御对抗性攻击:训练模型识别恶意指令
- 隐私保护:浏览数据不存储在服务器上
体验
ChatGPT智能体今日起向Pro、Plus和Team用户开放,Enterprise和Education用户将在7月获得访问权限。Pro用户可执行近乎无限任务,其他付费用户每月50次任务额度。
虽然这次发布未能像过去OpenAI的发布带来让人wow的新东西,但它又一次指向了确定性的趋势。正如网友评论:”我们刚从AI副驾驶跳跃到AI驾驶员,这不只是功能更新,而是范式转变。“
公众号回复“进群”入群讨论。
(文:AI工程化)