就前面文章Sam Altman所讲,编程将是第一个被变革的行业(Sam Altman 在Sequoia AI ascent访谈洞见)。OpenAI 昨夜发布了其最新的研究预览版 Codex,一款集成在 ChatGPT 中的高级编码智能助理。这一消息无论对于开发者还是非开发者而言,都预示着编码方式的又一次革新。Codex 不仅仅是一个工具,更像一位远程软件工程伙伴,能够并行处理多项编码任务,潜力巨大。
Codex 究竟是什么?
Codex 是一款强大的云端软件工程智能体,基于 OpenAI 最新的 codex-1 模型构建。据 OpenAI 称,这是他们迄今为止最出色的编码模型。它被设计用来理解自然语言指令,并将其转化为可执行代码,支持包括 Python、JavaScript、Go、Perl、PHP、Ruby、Shell、Swift 和 TypeScript 在内的十几种编程语言,其中在 Python 上的表现尤为出色。

Codex 的研究预览版已向 ChatGPT 的 Pro、Enterprise 和 Team 用户开放。
核心功能与亮点
-
深度代码分析与优化建议:Codex 能够深入分析现有代码库,精准定位可改进的区域,并提供具体的优化建议。用户可以直接在 ChatGPT 界面内安排这些优化任务。
-
强大的并行处理能力:它可以同时处理多个编码任务,显著提升开发效率。 -
独立安全的沙盒环境:每个任务都在 OpenAI 的基础设施上运行,拥有独立的微型虚拟机(VM)沙盒,包含独立的文件系统、CPU 和内存。这意味着用户无需担心本地计算资源,智能体可以在这个环境中自由安全地执行操作。 -
可配置性与引导性:用户可以通过 Markdown 文件(例如 Codex-CLI)为 Codex 提供重要的指令和偏好设置,以引导模型的行为和输出。
-
自动化测试与代码规范:在进行代码更改后,Codex 会自动运行测试用例,并使用 linter 工具来验证代码是否符合预设的风格规范。它会参照用户提供的 Markdown 指导文件来执行这些关键步骤。
-
高质量代码输出:codex-1 模型经过精心训练,注重代码质量和风格,并能更好地避免生成用户未明确要求的额外代码。它在软件工程(SWE)任务上的表现甚至超越了之前的 o3-high 模型,即便没有 AGENTS.md 或自定义脚手架的辅助。

-
与人类偏好对齐:OpenAI 在 Codex 上投入了大量对齐工作,使其能够生成更整洁、更符合程序员偏好、标准和指令的代码补丁及整体代码。 -
便捷的摘要预览:用户可以快速验证智能体所做工作的摘要,例如预览测试结果。 -
多样化的应用场景:OpenAI 工程师已将 Codex 应用于多种日常任务,包括: -
代码重构 (refactoring) -
变量/函数重命名 (renaming) -
编写测试用例 (writing tests) -
搭建新功能框架 (scaffolding new features) -
连接组件 (wiring components) -
修复错误 (fixing bugs) -
起草文档 (drafting documentation)
codex-mini-latest API 版本
除了集成在 ChatGPT 中的版本,OpenAI 还通过 API 提供了 codex-mini-latest 模型。

-
这是一个为 Codex CLI 特别优化的 o4-mini 微调版本。 -
拥有 200K 的上下文窗口和 100K 的最大输出 token。 -
支持推理 token。 -
定价为:输入 6.00/1M tokens,并享有 75% 的提示缓存折扣。1.50 / 1 M t o k e n s ,输出 -
目前尚不支持图像输入,也无法在任务执行过程中进行实时纠正。支持与代码智能体的异步协作。
系统要求 (针对本地使用如 Codex CLI): -
操作系统:macOS 12+, Ubuntu 20.04+/Debian 10+, 或 Windows 11 via WSL2 -
Node.js:22 或更新版本 (推荐 LTS) -
Git (可选,推荐):2.23+ (用于内置的 PR 助手) -
RAM:最低 4GB (推荐 8GB)
潜在影响与展望
就Codex产品而言实际表现如何还需要接下来的使用评价,但长期看,不论是以人为主导的vibe编程,还是Codex这样的自主编程智能体,都指向一个点,软件开发行业将面临重构,普通的只是照着需求写代码的程序员将没有生存空间。同时,由于开发成本和开发效率的大幅提升,如何打造产品的范式也将发生变化。
参看:三个新“摩尔定律”,推动世界在AI时代加速前进
(文:AI工程化)