ChatGPT长了手脚,AI不再是副驾,直接抢过方向盘

OpenAI跳票开源模型,却在昨夜发布了ChatGPT智能体,能够像人类一样在网页上点击、输入、操作,真正从”副驾驶”跃升为”真正的助手”。

三大核心能力完美融合

ChatGPT智能体将三项强大功能有机整合:

  • Operator的网站交互能力 – 可以在网页上滚动、点击、输入
  • 深入研究的信息整合优势 – 擅长分析和总结网络信息
  • ChatGPT的对话交互能力 – 自然流畅的人机对话

这种融合让AI能够智能选择最优路径完成任务:快速通过API获取数据,同时与人类设计的网页进行视觉交互,所有操作都在ChatGPT自身的计算环境中完成。

ChatGPT智能体会智能浏览网站、筛选结果、运行代码,甚至生成精美的幻灯片和电子表格。

最重要的是,用户始终掌握控制权——AI会在执行重要操作前征得许可,用户可随时中断或接管。

性能表现达到行业领先

在多项权威评估中,ChatGPT智能体创下新纪录:

  • 《人类的最后考试》评估:43.1分新高
  • SpreadsheetBench测试:性能较GPT-4o提升超过一倍
  • 投资银行分析师任务:显著优于其他模型
  • WebArena基准测试:超越o3驱动的模型

安全与控制并重

面对AI拥有操作权限的新风险,OpenAI部署了多重安全措施:

  • 明确用户确认:敏感操作前必须获得授权
  • 主动监督模式:关键任务需要逐步批准
  • 抵御对抗性攻击:训练模型识别恶意指令
  • 隐私保护:浏览数据不存储在服务器上

体验

ChatGPT智能体今日起向Pro、Plus和Team用户开放,Enterprise和Education用户将在7月获得访问权限。Pro用户可执行近乎无限任务,其他付费用户每月50次任务额度。

虽然这次发布未能像过去OpenAI的发布带来让人wow的新东西,但它又一次指向了确定性的趋势。正如网友评论:”我们刚从AI副驾驶跳跃到AI驾驶员,这不只是功能更新,而是范式转变。

公众号回复“进群”入群讨论。

(文:AI工程化)

发表评论