昨晚,OpenAI 上了个新功能:
Codex,云端的 Coding Agent
Codex 简要概述
这东西,由 3 部分组成:
codex-1 模型、云端沙盒、GitHub 接口封装不错的产品,交互很赞
但不能自主装依赖,目前干不了活
这个 Agent 的功能大概包含:
-
• 问答 Git 上的项目 -
• 跑现成的代码 -
• 修代码,提 PR(修改代码,然后提交上去)
按 OpenAI 员工的说法,他们部分时候也会拿这个处理代码


用例实测
我必须再次说:这东西目前限制很多,包括不仅限于:
-
• ❌ 不能联网(不能访问外部 API、网站) -
• ❌ 不能临时装依赖(如 pip install 无效) -
• ✅ 只能用你仓库里已有的代码 + 你事先配置好的环境
所以这东西,只能做缝补,几乎干不了重活
我能想到的几个典型场景:
-
• QA 大佬们的代码 -
• 写一点不需要配环境的代码
QA DeepEP
DeepEP 是之前 DeepSeek 开源的 Infra 框架,我先把它丢进去,选择「询问」就好了
写 Verilog
我本职专业,是EE。
Verlog 这东西,和常规环境没啥关系,但非常依赖 AI 对整体项目的理解,而且完全不能依赖 Rag 代码。
效果是不错的,改改能用(毕竟 o3)。
背后的实现
说真的,这东西的实现并不复杂,相信很快就会有一堆类似的。
分为三块:模型、云端沙盒、打通 GitHub,分别来说说
模型
Codex 背后的模型是 codex-1,通过 o3 调出来的,让风格更贴近「人写的代码」,并且准确性也提升了一些。
以及,发了一个同源的模型:codex-mini-latest,输入 $1.5,输出 $6 每百万 token,比 o4-mini 贵了 30%左右。

调的方法,叫做 Reinforcement Learning, 强化微调,之前介绍过:
👉 OpenAI 新货详解:强化微调
云端沙盒
Codex 的代码是跑在云端的,会为每个任务启动一个独立的云端沙盒环境,这环境里:
-
• 预先拉好你选的 GitHub 仓库(只读) -
• 跑你配置好的构建脚本、测试命令、lint 等 -
• 不联网,也没办法 pip install
大致就是“开了一台干净的服务器”,只装你确认过的东西,它再在里面开始「干活」。

注意:所有修改都只在这个沙盒里完成,Codex 不能直接动你线上仓库的代码,最终得你点按钮发 PR 或下载补丁。
打通 GitHub
Codex 需要你授权 GitHub:
-
• 你点「Connect GitHub」之后,它会拿到你的仓库只读权限(或者写权限,如果你开了) -
• 如果你是团队账户,还要选组织、设定权限范围 -
• 需要启用 MFA(多因素认证),毕竟你让 AI 有权限提 PR,可以用 Google Auth 或者任何,这里我用的 OnePass

可以吹,别过分
老实讲…
这些任务,不用 Codex 也能完成
这个东西全名叫 Codex Research Preview,单纯 Preview 已经不够了,还得加上 Research,毕竟啥活也干不了,不要有太高的期待
但是,方向是很赞的。
假想一下
你干活干到一半去吃法了,AI 无缝接管了你的环境,继续完成你的工作
总结一下
Codex 是 ChatGPT 新加的远程代码助手。它:
-
• 产品设计确实不错,放心也很稳 -
• 云上跑,隔离安全 -
• 模型靠谱(codex-1 微调自 o3) -
• 流程清晰,输出可追溯(log、diff、测试结果)
但:
-
• 不能联网 -
• 不能装包 -
• 只能在你给定的框架里改点东西
保持关注
这个东西全名叫 Codex Research Preview,单纯 Preview 已经不够了,还得加上 Research,目前不要有太高的期待
👉 chatgpt.com/codex
(文:赛博禅心)