ChatGPT Codex 完整使用教程,2026 自动写代码 8 步实操
🌐 Read in EnglishChatGPT Codex 是 OpenAI 2025 年 10 月正式发布的代码 Agent 产品,2026 年 5 月已经迭代到第二代。和早期 ChatGPT 写代码不同,Codex 不是简单聊天给代码,而是一个能在容器里自主跑命令、提 PR、跑测试、修 bug 的完整智能体。本文按 8 步实操讲清楚怎么从零上手。
文章假设读者已经有 ChatGPT 账号,并且会基本 git 和命令行操作。如果完全零基础,建议先看 Notion AI 或 Cursor 教程入门,再回来看 Codex。
ChatGPT Codex 和普通 ChatGPT 的核心区别

普通 ChatGPT 写代码是单轮问答。你贴一段需求,它回一段代码,你贴一段错误,它回一个修正方案。Codex 不是这种工作模式。它在 OpenAI 云端启动一个 Linux 容器,把你的整个仓库 clone 进去,然后能自主跑 npm install、跑 pytest、改文件、提 commit、推 PR。
简单说 Codex 把 ChatGPT 升级成了一个能"工作"的同事而不是只能"建议"的顾问。你交一个 GitHub Issue 给它,它能从读代码到提交 PR 全流程完成。中间不需要你手动复制粘贴。
订阅和访问门槛

Codex 目前只对 ChatGPT Plus 和 Pro 用户开放。Plus 20 美元每月每天可以跑 20 个任务。Pro 200 美元每月每天可以跑 200 个任务。免费用户暂时不能用 Codex,这一点和 GPT-4o 不同。
如果你团队多人协作,ChatGPT Team 计划 30 美元每人每月起步。Codex 任务额度可以池共享。Enterprise 计划另算价格,配 SLA 和 SOC2 合规。
第一步在 ChatGPT 侧栏激活 Codex

登录 chatgpt.com 后,左侧栏底部找"Codex"入口。第一次点会引导授权 GitHub。授权流程把你 GitHub 账号下指定的仓库授权给 Codex Agent 读写。建议只授权需要操作的仓库不要全开。
授权后 Codex 自动 fork 一个隔离的 Linux 容器。这个容器每次任务都是 fresh 状态,不会保留上一次的中间文件。环境默认装了 Node 22、Python 3.12、Go 1.23、Ruby 3.3、Rust 1.78,主流语言基本都覆盖。
第二步配置项目环境

仓库根目录加一个 codex.yml 配置文件。里面写两段。setup 段定义环境安装步骤,比如 npm install 或 poetry install。test 段定义测试命令,比如 npm test 或 pytest -v。Codex 会按 setup 准备环境,按 test 验证你的改动。
如果你的项目用 Docker 也可以指定 Dockerfile。Codex 会按 Dockerfile 构建容器再跑。这种方式适合环境复杂依赖系统包的项目。比如需要 libpq-dev、ffmpeg、postgres-client。
第三步提交第一个任务

回到 Codex 界面点 New Task。在输入框里写自然语言任务描述。比如"帮我把 src/auth.ts 里的 JWT 验证逻辑加上签名过期校验,并补一个单元测试"。提交后 Codex 会先读相关文件,思考一段时间,然后开始编辑。
整个过程在 Codex 界面里实时显示。你能看到它读了哪些文件、跑了哪些命令、改了哪些行。如果中途方向跑偏,可以直接打断说"先看 src/middleware.ts 里 verify 函数怎么用的"。
第四步审核 diff 和推送 PR
任务完成后 Codex 给你一个完整 diff 视图。每个文件改动都按 GitHub style 显示,红色减绿色加。你可以一个一个 hunk 确认。如果有不同意的部分可以直接编辑或要求重做。
满意后点 Create PR,Codex 自动 push 到一个新分支,并在 GitHub 上开 PR。PR 描述里会自动写改动说明、关联的 Issue、跑过的测试结果。整个流程 5 到 30 分钟一个完整 PR,中等复杂度任务正常。
Codex 擅长的任务类型
实测 Codex 最擅长以下几类任务。第一类是补单元测试,给它一个未覆盖的函数能直接生成完整测试文件。第二类是重构,比如把 callback 改成 async/await、把类组件改成函数组件。第三类是修 lint 错误,跑一遍 lint 把所有 warning 全部静默修复。
第四类是改文档,能根据代码反向生成 README。第五类是依赖升级,把 React 17 升到 18 这种跨版本迁移 Codex 跑一次基本能完成 80%。
Codex 不擅长的任务类型
Codex 也有明确短板。第一类是需要大量业务上下文的任务,比如"按业务规则改成新的支付流程"。它不知道你公司的支付背景。第二类是涉及前端 UI 视觉的,没法看到页面渲染结果只能猜。
第三类是性能优化,需要 profiling 数据 Codex 拿不到。第四类是大规模架构调整,跨 50 个文件的改动 Codex 容易丢失上下文。建议把大任务拆成 5 到 10 个小任务分别交给 Codex。
实测和 Cursor Claude Code 的对比
Cursor 是 IDE 内嵌的 AI 助手,主打"快速对话改代码"。Codex 是异步 Agent,主打"扔一个任务回头收 PR"。两者用法不同不冲突,互补使用。开发当下边写边改用 Cursor,下班前扔几个任务给 Codex 让它跑通宵。
Claude Code 是 Anthropic 出的命令行 Agent,能力和 Codex 接近。区别在 Claude Code 跑在你本地终端,Codex 跑在 OpenAI 云端。本地隐私好但要自己装 Docker,云端方便但代码要给 OpenAI 看。2026 年 5 月企业用户用 Codex 更多,个人用户偏 Claude Code。
安全和成本的注意事项
Codex 跑在 OpenAI 云容器里,代码会被读取分析但默认不用于训练。可以在 Settings 里关闭"Improve the model"避免训练。但敏感企业代码建议还是用 Claude Code 本地跑或者自建 OpenAI Enterprise 私有部署。
成本上每个 Codex 任务平均消耗 50000 到 200000 tokens,按 GPT-4o 定价大约 0.1 到 0.5 美元每任务。Pro 计划下每天 200 个任务用满相当于 100 美元,不算便宜。建议优先把重复性高的任务交给 Codex 价值最大。
团队协作和最佳实践
团队场景下 Codex 表现比单人更出色。每个工程师把日常 1 到 2 个琐碎任务扔给 Codex 跑,Code Review 集中处理。一周下来一个 5 人小组能多产出大约 30% 代码量。重点不是替代人,而是让人专注做架构决策和复杂业务逻辑。
最佳实践包括,任务描述写得越具体越好,给出文件路径和函数名比给抽象描述准确率高一倍。每个任务限定单一目标不要"修 bug 顺便重构",那样 PR 会失控。配合 PR 模板让 Codex 自动填测试覆盖率和 changelog。重要分支配 Required Review 不让 Codex PR 自动合入。
团队治理上建议把所有 Codex 提交统一标 commit message 前缀比如 codex 或 bot,方便审计和事后追溯。每月统计 Codex PR 通过率,低于 60% 说明任务定义有问题需要调整。
未来一年的迭代方向
OpenAI 内部 Roadmap 透露 Codex 2026 年下半年会加几个能力。第一是多仓库联动,一次任务可以跨 3 到 5 个仓库改代码比如同时改前端后端 SDK。第二是更强的代码理解,能读懂 100 万行级别大型 monorepo 的全局上下文。
第三是和 ChatGPT 主对话深度集成,普通聊天里直接说"帮我把这段需求开个 PR",自动跳到 Codex 完成。第四是支持本地 IDE 同步预览,让 Cursor VSCode 用户在 IDE 里看 Codex 远程容器状态。
Anthropic Claude Code 和 Google Jules 也在做类似产品。预计 2027 年市场会出现 3 到 4 个稳定的代码 Agent 服务,各占细分场景。OpenAI Codex 凭借生态优势仍是综合首选。
常见问题 FAQ
Codex 是免费的吗
不是免费的。Codex 是 ChatGPT Plus 和 Pro 订阅的附加功能。Plus 20 美元每月每天 20 个任务额度,Pro 200 美元每月每天 200 个任务。免费用户暂时无法使用 Codex。OpenAI 表示未来可能开放免费试用但目前没有时间表。
Codex 改的代码安全可信吗
Codex 改的代码必须经过你的人工 review 才会合并。它生成的 diff 默认不会自动 push 到 main,全部走 PR 流程。但生成的代码偶尔有 bug、有 security 漏洞、有 API 误用。重要项目建议配合 Code Review 工具二次审核,不要盲合 Codex 的 PR。
Codex 和 Cursor 哪个更好
两者定位不同没法直接比较。Cursor 是 IDE 内的快速对话助手,适合开发当下边写边改。Codex 是云端 Agent,适合扔任务异步等结果。两者互补使用,开发用 Cursor,回家用 Codex 跑通宵任务。预算够的话两者都订效率最高。
Codex 支持中文交流吗
支持。任务描述可以用中文写,Codex 完全理解。但代码本身建议用英文注释,因为 Codex 在英文代码上训练数据多表现更稳定。中文变量名也可以但下游工具链可能不兼容。建议任务描述用中文代码本身用英文。
Codex 能改私有公司代码吗
可以。GitHub 授权流程支持私有仓库。但代码会上传到 OpenAI 云容器,敏感商业代码要考虑合规风险。OpenAI Enterprise 计划提供 SOC 2 Type II 认证和数据不用于训练承诺。如果是金融医疗等强监管行业建议先和法务确认再用。
📝 本文来自抖文 www.douwen.me ,转载请保留出处。
原文链接:https://douwen.me/archives/990/
💬 评论 (7)
作者花了很多心思
数据扎实不是水文
正好需要这种实测对比
条理清楚,一看就懂
结构清晰看着不累
期待更多类似干货
收藏了反复看