← 深度指南

Codex 深度指南:从安装到交付项目

1. Codex 是什么:不是聊天,是把任务交给一个会动手的程序员

普通 ChatGPT 更像顾问:你问它怎么做,它给你解释、方案、代码片段。Codex 更像一个坐在你电脑旁边的程序员:它能进入项目目录,读文件,改文件,跑命令,再把结果给你看。

你可以把 Codex 理解成三件事的组合。第一,它会读项目上下文,不是只看你复制进去的几行代码。第二,它能直接修改本地文件,所以适合做真实项目里的小功能、修 bug、补文档、重构。第三,它会运行命令,比如安装依赖、跑测试、启动构建,但高风险操作应保留人工确认。

适合交给 Codex 的任务包括:解释一个陌生项目、补一个页面、修一个报错、写单元测试、改接口字段、生成 README、检查代码风险、把重复代码抽成组件。不适合一开始就交给 Codex 的任务包括:没有需求说明的大型系统重构、涉及资金或用户数据的生产库操作、你完全看不懂也不准备验收的代码变更。

小白最容易犯的错是把 Codex 当成“许愿机”。正确做法是把任务写成验收标准:要改哪个页面、成功后看到什么、不能破坏什么、怎么测试。Codex 做得越像真实外包,效果越稳定。

2. Codex 安装:Mac、Linux、Windows 和 npm 方案

3. 登录与账号:ChatGPT 登录和 API Key 登录怎么选

4. 第一次使用:让 Codex 读懂项目,而不是马上乱改

第一次不要让 Codex “帮我优化整个项目”。先让它只读不改:

先不要修改任何文件。请阅读当前项目,告诉我:
1. 这个项目是做什么的;
2. 前端、后端、数据文件分别在哪里;
3. 启动命令是什么;
4. 最容易出问题的地方有哪些;
5. 你建议我下一步先改哪 3 个小任务。

这一步的价值是建立共同上下文。Codex 会看目录、配置、脚本、README,然后给你项目地图。你要把它的总结当成“入场检查”,不是最终结论。如果它误解了项目,你要立刻纠正。

第二步再让它做一个很小的改动,例如改按钮文案、补一个 README 段落、修一个明显报错。提示词要写清楚范围:

请只修改首页标题和描述,不要改路由、接口和样式结构。修改后告诉我改了哪些文件,并给出本地检查命令。

验收时看三样:它改了哪些文件;是否超出范围;是否给出可运行的验证命令。小白不要只看“它说完成了”,要看 Git diff。

5. 让 Codex 解释陌生项目:接手 GitHub 源码的第一步

很多人下载 GitHub 项目后卡住,不知道从哪里开始。Codex 的一个高价值用法就是“项目导游”。把项目拉下来后,进入根目录:

git clone <项目地址>
cd <项目目录>
codex

然后输入:

请用小白能听懂的话解释这个项目。重点说明:
- 项目解决什么问题;
- 主要技术栈;
- 入口文件;
- 配置文件;
- 数据存放位置;
- 本地启动步骤;
- 部署前必须改哪些配置。
先不要修改文件。

如果你要把 GitHub 源码包装成自己的产品,这一步尤其重要。不要急着改 UI,先搞清楚授权、环境变量、数据库、登录、支付、部署方式。否则你会出现“首页能跑,核心功能全挂”的情况。

进阶提示词:

请把这个项目拆成 10 个适合小白理解的模块,每个模块说明:作用、关键文件、能不能删、常见改法、风险等级。输出成 Markdown 表格。

这段内容可以直接变成你网站里的“源码讲解”付费内容。

6. 让 Codex 改代码:小步提交,别一次改一大片

Codex 能改代码,但你要控制节奏。推荐流程是“一次一个任务、一次一个提交、每次都能回滚”。

标准提示词:

任务:给百科详情页增加一个“相关指南”区域。
范围:只允许修改前端详情页组件和必要的样式文件。
要求:
1. 如果没有相关指南数据,不显示空标题;
2. 不影响原有 relatedWiki;
3. 修改后运行现有构建或检查命令;
4. 最后列出修改文件和测试结果。

不要写:

帮我把项目优化一下。

这个提示太空,Codex 会自己猜,结果可能改路由、改样式、改数据结构,最后你不知道哪里坏了。

每次改完后执行:

git diff
git status

如果你满意,再提交:

git add .
git commit -m "feat: add related guide section"

如果不满意,回滚:

git restore <文件名>
# 或者放弃所有未提交修改
git restore .

付费技巧:要求 Codex 先输出“修改计划”,你确认后再动手。提示词可以写:

先给计划,不要修改文件。计划里必须列出预计修改文件、风险点、验证命令。等我回复“开始改”后再执行。

7. 测试、构建与调试:让 Codex 负责找证据

真正能卖钱的 AI 编程,不是“生成代码”,而是“生成后能跑”。每次让 Codex 修改功能,都要让它跑测试或构建。

常用检查命令:

npm run lint
npm run test
npm run build
npm run dev

如果项目没有这些脚本,让 Codex 先读 `package.json`:

请检查 package.json,告诉我这个项目有哪些可用脚本,哪个用于本地启动,哪个用于构建,哪个用于测试。先不要运行会修改数据的命令。

报错时不要只复制最后一行。给 Codex 完整上下文:执行了什么命令、完整报错、你期望什么、实际发生什么、最近改过哪些文件。

调试提示词:

我执行 npm run build 报错如下。请先判断是语法错误、类型错误、依赖错误、环境变量错误还是构建配置错误。不要直接大改,先指出最可能的 3 个原因和最小修复方案。

<粘贴完整报错>

让 Codex 修 bug 时,要求它解释“为什么这样修”。否则它可能只是把报错隐藏掉,例如用 `any` 跳过类型,或者把失败测试删掉。这种修法短期能过,长期会埋雷。

8. 代码审查:让另一个 Codex 帮你检查 Codex

Codex 改完代码后,可以再开一个审查任务,让它站在审查者角度检查。重点不是让它夸自己,而是让它找风险。

代码审查提示词:

请审查当前未提交改动。重点检查:
1. 有没有超出需求范围;
2. 有没有破坏现有功能;
3. 有没有安全问题;
4. 有没有硬编码、重复代码、错误处理缺失;
5. 有没有需要补测试的地方。
请按“必须修 / 建议修 / 可以不管”分组输出。

如果你在做付费内容或客户项目,建议把“审查报告”作为交付物之一。客户不只要你说“做好了”,还要知道你怎么保证没乱改。

更稳的流程是:ChatGPT 写需求,Codex 改代码,Claude Code 或另一个 Codex 做审查。三者不要混成一个窗口。一个窗口负责需求,一个窗口负责施工,一个窗口负责验收,质量会明显更稳定。

9. Git 工作流:每个 AI 任务都要能撤回

不会 Git,就不要让 AI 大规模改项目。最低要求是会看状态、看差异、提交、回滚。

每次开始前:

git status

如果有未提交改动,先处理掉。不要在一堆脏文件上让 Codex 开始改,否则出了问题很难回退。

推荐分支流程:

git checkout -b ai/add-wiki-guide-links
codex
# 让 Codex 完成任务后
git diff
git add .
git commit -m "feat: add wiki guide links"

如果项目被改坏:

git restore .

如果已经提交但想撤回:

git log --oneline
# 找到上一个安全提交后
# 谨慎使用:会丢弃之后提交
git reset --hard <commit-id>

付费交付建议:每个任务一个分支,每个分支一个明确提交信息。这样你可以把“AI 做了什么”讲清楚,也方便 Codex 或 Claude Code 后续继续接手。

10. MCP 与外部工具:让 Codex 连接文档、浏览器、设计稿

MCP 可以理解成“给 AI 接工具的标准插座”。Codex 支持通过 MCP 连接第三方文档、浏览器、Figma 等工具。不是所有人一开始都需要 MCP,但当你反复让 Codex 查同一类资料、操作同一类工具时,就值得配置。

官方文档说明,Codex 的 MCP 配置默认放在 `~/.codex/config.toml`,也可以在可信项目里放 `.codex/config.toml`。可以通过命令添加 MCP server,例如:

codex mcp add context7 -- npx -y @upstash/context7-mcp

进入 Codex 后可用:

/mcp

查看已连接服务。

小白不要一开始就堆十几个 MCP。先问自己三件事:这个工具是不是经常用?它会不会拿到敏感数据?出了错能不能撤回?

推荐优先级:文档类 MCP 优先,设计稿类其次,能操作线上系统的 MCP 最后。凡是能删数据、发消息、改生产配置的工具,都必须加人工确认。

11. 批量任务与自动化:让 Codex 做重复但可验收的工作

Codex 适合做批量但规则明确的任务,例如:补 50 个页面的 meta description、给 20 个 Markdown 文件统一加目录、把 JSON 字段统一改名、给每个 API 增加错误处理。

批量任务的关键是先做样板。不要直接说“把所有页面都改了”。正确流程是:先改 1 个文件,验收;再改 5 个文件,验收;最后批量改。

提示词:

请先只处理 1 个样板文件,不要批量修改。目标是把指南章节里的“空章节”替换为完整正文。完成后列出你采用的结构,我确认后再处理其余文件。

批量修改前,要求 Codex 输出影响范围:

在修改前,请先列出将被修改的文件清单、每类修改规则、可能风险、回滚方式。不要立即执行。

适合自动化的任务有:格式整理、字段补全、文案统一、测试补齐、文档生成。不适合自动化的任务有:价格策略、合同条款、数据库删除、支付逻辑上线、生产密钥轮换。

12. 常见报错:安装、登录、权限、构建失败

13. Codex、Claude Code、ChatGPT 怎么分工

最省钱、最稳定的分工是:ChatGPT 做产品经理,Codex 做程序员,Claude Code 做复杂代码协作和长上下文审查。

ChatGPT 适合:需求拆解、商业模式、页面文案、提示词、百科词条、操作手册。它不直接碰项目文件,适合把混乱想法整理成清晰任务。

Codex 适合:在本地项目里按任务改代码、跑测试、解释项目结构、生成补丁。它的强项是“动手”。

Claude Code 适合:长时间理解项目、持续协作、复杂重构、团队式开发流程。它也能动手,但你要给它明确边界。

推荐流水线:

1. ChatGPT:把想法整理成任务单。
2. Codex:按任务单修改项目。
3. Claude Code:审查改动,找遗漏。
4. Codex:按审查意见修复。
5. ChatGPT:把完成情况写成给用户看的更新记录。

这样做的好处是每个 AI 都有角色,不会互相抢活。你作为老板,只负责定目标、验收、决定是否上线。

14. 付费模板:可复制的 Codex 任务单