OpenAI升级AI编码能力!深度研究代理打通GitHub,Codex支持智能体循环分析改进

文丨丁灵波

OpenAI最近正在进行一些全新技术布局,以在AI编码赛道取得更大竞争优势。

今天,OpenAI宣布为ChatGPT深度研究推出首个 “连接器”功能,开发者现在可以将GitHub存储库连接到ChatGPT中的深入研究,提出问题后,深度研究代理将阅读并搜索代码库的源代码和拉取请求(PRs),并返回包含引用的详细报告。

此外,OpenAI也对旗下实验性开源项目Codex CLI进行了改进,让AI编码助手的功能不再局限于自动补全或者静态建议,而是能实现更具交互性、自动化的开发工作流程。

Codex CLI专为那些已经习惯使用终端,并希望拥有ChatGPT级别推理能力以及实际运行代码、操作文件和迭代能力的开发者打造,简而言之,这是一种AI对话驱动的开发方式,且能够深度理解开发者意图并操作执行代码库。

内部技术栈完善加上30亿美元收购人工智能编码助手Windsurf带来的产品组合增益,OpenAI或将给AI编码市场带来新一轮冲击。

真正的RAG?

将GitHub代码库连接到ChatGPT深度研究的功能目前处于测试阶段,仅ChatGPT Plus、Pro和Team用户可使用。

OpenAI官方表示,索引可能需要大约5-10分钟才能供连接器使用,当开发者将GitHub连接到深度研究时,ChatGPT可以从代码库(代码、README 文件和其他文档)中提取实时数据,并对其进行实时推理,只需连接并提出问题,深度研究就会直接从开发者的GitHub内容中读取、分析和引用相关代码片段。
部分已上手的开发者体验后表示,感觉就像有一个打了兴奋剂的代码审查伙伴,它能挖掘所有内容,甚至是旧的PRs,终于有了一个真正有意义的GitHub智能集成。

也有开发者认为,这个测试功能未来可能比想象中更重要,有了它,开发者或许可以链接操作任何开源资源库,并让ChatGPT深度研究帮忙制定详细开发计划,实现“GitHub-chat”和真正的“RAG”。

在代码开发领域,检索增强生成(RAG)是一种将外部知识源(如文档、代码库、数据库等)与大型语言模型(LLM)相结合的技术架构,人工智能如能从开源社区代码库资源和数据流中自动学习、分析和操作、执行,将是一个足以改变开发市场游戏规则的因素。

也有开发者称赞,比起在初始化Autovibe代码空间时把代码库加载到大型语言模型的上下文里,这种方式要简洁得多,ChatGPT+GitHub提供了更清晰的工作流程,帮助提升开发者们的创造力。
一个实验中的开源编码代理
将ChatGPT链接GitHub可能只是一道开胃菜,OpenAI正在加速构建完善一个开源轻量级编码代理Codex CLI,目前该项目在GitHub上已获得21.8k颗星,得到了广泛关注。
在最新发布的技术文档中,OpenAI介绍,Codex命令行界面(CLI)是一款基于终端的开源编码助手,它利用人工智能(OpenAI模型)通过自然语言与本地代码库进行交互。
从本质上讲,它将一个AI模型封装在命令行工具中,使开发者能够请求代码修改、获取解释,甚至直接从命令行执行代码,它除了提供文本回答外,还能代表用户执行操作(如运行shell命令或编辑文件)。

其重要性在于,Codex CLI将AI编码助手的能力扩展到自动补全或静态建议之外,实现了更具交互性和自动化的开发工作流程。比如:

1、自由格式请求理解。能够解析关于代码或项目的自然语言描述,并执行相应操作,开发者可以提供提示信息、项目上下文甚至文件名,它会根据这些信息生成回应。例如“请为这个函数添加类型注释”或“修复用户认证模块中的登录错误”;

2、流式响应与工具调用。通过流式输出实时显示结果,并可按需调用外部工具(如shell 命令)。这意味着AI不仅能提供建议,还能主动执行操作(如运行测试、生成代码补丁),真正实现自动化任务处理;

3、版本控制集成。直接对版本控制下的文件应用代码修改,并能确保所有更改都可追溯;

4、自动化测试与验证。在沙盒环境中执行shell命令或测试用例,验证代码修改的效果;

5、灵活的审核策略。对低风险操作(如添加注释)能自动应用执行,而在执行敏感操作(如删除文件、运行系统命令)前会请求开发者确认。

此外,Codex CLI介绍的另一点技术创新是“智能体循环”,它在多轮交互中可以仔细管理开发状态,使AI能够调用诸如shell之类的工具,接收结果,并持续对话,直到任务得到解决,该循环结合了流式响应和对函数调用的逐步处理,以实现自主智能体代码生成和优化行为,同时仍给予开发者控制权。

从更广泛的开发者背景来看,Codex CLI或将是未来代理式编码工作流程的一个重要参考实例和实验工具,推动实现可自我改进的人工智能。

分享数据还能打折

最后,面对AI企业和组织,OpenAI今天还正式上线了强化微调(RFT)技术和指南,能够分享数据集的客户还可享受五折价格优惠。

OpenAI的强化微调(RFT)提供了一种提升模型在特定任务上性能的方法,通常这些任务必须明确且有可验证的答案。

OpenAI介绍了不同领域的用例,例如半导体组合供应商ChipStack想要构建用于芯片设计和验证的AI工具,旨在减少开发和验证复杂半导体芯片的时间和成本,其中一项极具挑战性且耗时的任务是将设计接口与验证IP精准绑定,因为验证IP种类繁多,每个IP都可能包含数十到数百个可映射的信号。

ChipStack准备了一个包含少于50个样本的数据集,然后执行了多个RFT变体,最终将OpenAI模型调成更匹配自身业务场景需求的模型。

结合不同领域和场景数据在OpenAI前沿模型上进行强化微调,OpenAI的模型可以化身成为许多垂直领域的专家级AI,而来自不同行业的数据会反哺顶尖大模型一步步进阶。

目前,OpenAI两大对手谷歌和Anthropic在AI编码领域的口碑、影响力都实力强悍,OpenAI在竞争中将以怎样的市场策略和技术创新突围是个看点。

(文:头部科技)

发表评论

×

下载每时AI手机APP

 

和大家一起交流AI最新资讯!

立即前往