技术文摘

OpenAI Codex CLI实战:从安装到多智能体并行,10个真实开发场景详解

OpenAI Codex CLI是基于Rust重写的开源终端智能体,GitHub 83K+ Stars。它的定位很清晰:不是聊天窗口,而是常驻终端的AI软件工程师——能读取代码库、修改文件、执行命令、运行测试、审查代码,甚至在云端沙盒中独立完成数小时的开发任务。

为什么选Codex CLI

  • 零额外成本:已订阅ChatGPT Plus/Pro即可使用,无需另付API费用
  • 开源可扩展:Apache-2.0协议,社区可自由fork、定制
  • 多平台覆盖:CLI + VS Code插件 + JetBrains插件 + 云端Agent + 桌面端
  • 多智能体架构:支持同时运行最多6个并发子Agent
  • MCP生态:通过Model Context Protocol连接外部工具链

5分钟极速安装

# 安装
npm install -g @openai/codex

# 启动交互模式
codex

# 一次性执行任务
codex exec "创建一个用户认证模块,包含JWT验证"

# 从断点继续上次任务
codex resume --last

AGENTS.md:区分平庸和高质量的关键文件

在项目根目录创建AGENTS.md,Codex每次会话开始时自动读取。它相当于给AI工程师一份项目入职手册。这是区分平庸输出和持续高质量输出的单一文件。

建议包含:项目规范、代码风格、测试要求、架构约定、常用命令、目录结构说明。

10个真实开发场景实战

场景1:从零创建REST API

描述需求后,Codex自动创建目录结构、编写类型定义、服务逻辑和测试文件。执行prisma migrate、npm test验证。若测试失败自动修复并重新运行。

场景2:跨文件重构

分析三个文件的共同模式 → 识别重复代码 → 创建抽象层 → 逐文件重构 → 自动运行测试验证。整个过程无需人工干预。

场景3:自动生成单元测试

指定需要测试的模块,Codex分析函数签名、边界条件、异常路径,生成完整的测试套件。

场景4:GitHub Issue自动修复

Codex的Triggers功能监听GitHub Issue,自动分析问题、定位代码、编写修复、提交PR。适合处理标签为"good first issue"的简单bug。

场景5:API文档自动生成

扫描代码中的路由和控制器,自动生成OpenAPI/Swagger格式的API文档。

场景6:性能分析与优化

分析代码中的性能瓶颈,提出优化建议并实施修改。

场景7:CI/CD配置

根据项目技术栈,自动生成GitHub Actions或GitLab CI配置文件。

场景8:数据库迁移

分析现有Schema变更,生成迁移脚本并验证兼容性。

场景9:国际化支持

扫描代码中的硬编码字符串,提取为翻译文件,添加i18n支持。

场景10:代码审查

使用内置reviewer子Agent对代码进行审查,发现潜在问题和改进建议。

Skills技能系统

Skills是Codex独有的概念,把常用操作流程封装成可复用的"技能包"。每个Skill由SKILL.md定义,包含指令和脚本。最关键是investigate Skill——Codex默认会跳过根因分析直接修复,而修复往往是错的。强制investigate-first是调试质量的最大提升。

多智能体并行工作流

Codex CLI支持子Agent:独立隔离的Agent实例,运行在自己的上下文中,返回摘要。三种用法:

  • 探索:派生子Agent读30个文件并总结
  • 并行实现:五个独立功能作为五个并发子Agent
  • 验证:新鲜reviewer子Agent不受"刚写完代码"偏见影响

Fleet:20行命令搭建Agent集群

Fleet是一个Python框架,能同时调度最多10个AI编程Agent并行干活。AMD已在生产环境验证50+会话并行的可行性。实测数据:3个Agent并行每小时完成5-10个任务,10+个Agent每小时20-50个任务。

性能优化建议

  • AGENTS.md是关键:没有它,Codex每次都要从头理解项目
  • investigate-first:调试时强制先分析根因再修复
  • 跨提供商验证:Codex写代码,Claude Code审查,捕捉不同模型的盲点
  • 批量小任务:合并多个小改动一次提交,减少Token消耗

Codex vs Claude Code选谁

维度Codex CLIClaude Code 定价ChatGPT订阅捆绑独立订阅 开源Apache-2.0闭源 上下文窗口1M tokens1M+ tokens 适合场景日常开发、脚本自动化超大仓库、复杂推理

很多开发者的实际配置是:Codex CLI做日常脚本和自动化任务,Claude Code做大型重构和架构级工作。两者互补而非竞争。