ChatGPT重磅功能!支持AI Agent玩法,OpenAI加入智能体了

今天凌晨2点,OpenAI开启了第11天的直播技术分享,对ChatGPT的应用程序进行了重磅升级,支持原生应用程序自动化协作功能。

其实,从OpenAI在直播中演示的案例来看,基本上与AIAgent功能差不多,尤其是在编程方面非常好。不再仅仅局限于简单的问答模式,而是能够主动理解用户的需求。

例如,在与Warp控制台和XcodeIDE的交互中,ChatGPT能够迅速判断用户的意图,无论是分析代码库的提交数据,还是解决复杂的编码逻辑问题,都能高效地自动解决这些难题节省大量开发时间。

值得一提的是,ChatGPT的协作模式除了文本模式,还支持高级语音模式,就像“贾维斯”那样用语音和他交互提出你的各种需求。

在直播中OpenAI是直接上功能演示案例,那下面「AIGC开放社区」就为大家解读一下这几个自动化写作示例。

编程自动化协作

在演示中,OpenAI的开发人员首先打开了Warp控制台,并导航到了正在使用的代码库。想要了解该代码库在过去两个月里每天的提交数量,但不知道如何获取。

于是,点击ChatGPT桌面应用中的协作按钮,会自动列出当前运行且ChatGPT可与之协作的应用程序。在选择Warp后,ChatGPT能够根据Warp中的上下文判断出用户正在使用Git,直接为其提供了获取每日提交数量的命令,并将命令复制粘贴到Warp中执行得到了相关数据。

为了更直观地展示数据,约翰进一步要求ChatGPT使用高级数据分析功能将结果以柱状图呈现,并指定为节日主题。也就是说,过去需要手动操作的固定、繁琐代码流程,现在ChatGPT可以自动帮你完成了。

接着在XcodeIDE开发环境中,打开一个示例应用程序,该程序使用MacOS可访问性API来查看Xcode并获取屏幕上的信息,例如,文本字段的尺寸、行数及内容等,这些信息被用于开发与Xcode交互的功能。

当用户要求添加观察者功能,例如,选择变化加载文本区域时,ChatGPT利用其思维链模型(o1模型)生成相应代码。好像在直播的时候,第一次展示并没有成功。不过第二次尝试就顺利实现了。这个案例也体现了ChatGPT全新的感知和自动化代码能力。

目前在编程方面ChatGPT的协作功能支持主流开发环境,包括VSCode、Jetbrains、RubyMine、BBEdit等,估计以后还会添加更多IDE开发环境。

写作场景协作

当我们在写一份深度报告或者内容时,总是希望有一位老师可以指导我们,例如,有哪些错别字,内容是否真实,标题起的好不好,以及实时获取想要的资料等,现在ChatGPT的协作功能就能轻松帮你完成了。

在直播案例中,开发人员正在使用Notion编写一个关于旧金山历史的步行游览文档,其中一个重要部分是介绍“诺顿皇帝”。他将ChatGPT与Notion完成集成,能够访问并理解整个文档的内容。

但在编写的过程中遇到了困难。他不清楚如何生动准确地描述诺顿皇帝的生平事迹,如何挖掘有趣的细节以吸引游客,同时也担心自己所写内容的事实准确性。

于是他选择了文档中的一个特定部分——关于“诺顿皇帝”的介绍,并启动了ChatGPT的协作功能,基于这一上下文生成讨论要点。

ChatGPT立即开始分析文档上下文,凭借强大的语言理解和生成能力,迅速为用户提供了丰富的信息。不仅补充了诺顿皇帝的生平细节,例如,他在旧金山的活动轨迹、与当地居民的互动等,还对其自称皇帝的行为和影响进行了更深入的阐述,为写作提供了丰富的素材。

为了验证ChatGPT编写的准确性,于是开启了网络搜索功能。当ChatGPT回答问题时,它会在互联网上广泛搜索可靠的信息源,并为生成的内容提供引用链接。例如,在介绍诺顿皇帝自制货币的流通情况时,ChatGPT引用了相关历史文献和研究资料,确保了信息的可信度。

但ChatGPT生成的内容风格比较生硬,于是要求它匹配整体上下文的协作风格。接着ChatGPT读取了文档的整体风格,包括语言表达方式、叙述节奏等,然后对之前生成的内容进行了调整,优化了语句结构,使表述更加流畅自然保持一致的上下文写作风格。

ChatGPT除了支持文本提供需求之外,还支持高级语音模式,可以直接与它对话完成你所有的需求。例如,在演示的过程中,一位开发人员想演奏萨克斯曲目,但是很多他不知道该选哪一首,通过语音模式让ChatGPT帮助选择并解释为什么是这些歌曲。

目前,ChatGPT的协作功能已经在Mac应用程序中可以使用了,通过Option+Space就能快速调用这个功能,并且占用的内存非常小,是一个不错的自动化协作助手。

(文:AIGC开放社区)

欢迎分享

发表评论