crossfire
Use when 需要多文件代码实现并要求异源模型(Claude + Codex)交叉审查,或架构方案需要对抗性质询验证。适用于大型编码任务的端到端协作,不适用于单文件小修改或纯数据处理。
git clone https://github.com/PlutoLei/crossfire
git clone --depth=1 https://github.com/PlutoLei/crossfire ~/.claude/skills/plutolei-crossfire-crossfire
SKILL.md/crossfire — Claude + Codex 交叉火力 Pipeline
核心理念
Claude Code (Opus 4.6) = Actor(架构师/审查员),Codex (GPT-5.4) = Executor + Critic(执行者/审计员)。异源模型交叉审查减少确认偏差——不同训练分布更可能发现对方盲区(arXiv:2602.03794)。Windows 环境下所有 Codex 调用需经过路径归一化预处理(详见 templates-and-faq.md「Windows 防护层」)。
| 角色 | 模型 | 职责 |
|---|---|---|
| 架构师 | Claude Opus 4.6 | 探索、规划、审查、修复、决策 |
| 执行者 | Codex gpt-5.4 | 编码实现、文件修改 |
| 审计员 | Codex gpt-5.4 | 架构质询(Phase 0)、代码终审(Phase 2) |
Skill 委托策略
crossfire 是编排器,复用已有 skill 的能力而非重写逻辑。
| 阶段 | L2 委托方式 | L3 委托方式 | 目标 Skill |
|---|---|---|---|
| Phase 0a EXPLORE | invoke | invoke | — 自主状态管理(task_plan.md / findings.md / progress.md) |
| Phase 0a-0b 多方案 | 参考原则 | invoke | — L2 参考多方案+YAGNI 原则;L3 invoke 交互式探索,用户参与方案选择 |
| Phase 0b PLAN 蓝图 | 参考格式 | invoke | — L2 参考蓝图模板格式;L3 invoke 交互式规划,用户确认蓝图 |
| Phase 1 EXECUTE | 自有逻辑 | 自有逻辑 | Codex CLI 调用 + 蓝图注入 + Windows 防护层(crossfire 自身实现) |
独有逻辑(不委托,crossfire 自身实现):
- Phase 0c DEBATE — Codex 质询蓝图
- Phase 0d LOCK — 冻结蓝图
- Phase 2 多层 REVIEW — Claude 初审 + Codex 终审 + 交叉审查
- Phase 3 REPORT — 结构化报告 + 自动提交
- 升级机制 — 3 轮上限 → 升级用户
何时使用
| 场景 | 使用 |
|---|---|
| 大量代码编写的实现任务 | ✅ |
| 需要异源模型审查提升质量 | ✅ |
| 架构设计需要对抗性验证 | ✅ |
| 简单单文件小修改 | ❌ 直接用 Claude Code |
| 纯数据处理、Notebook 开发 | ❌ |
四阶段 Pipeline
L1: Phase 1(EXECUTE) → Phase 2(Claude快审) → Phase 3(REPORT) L2/L3: Phase 0(EXPLORE→PLAN→DEBATE→LOCK) → Phase 1(EXECUTE) → Phase 2(多层REVIEW) → Phase 3(REPORT)
Phase 0: EXPLORE → PLAN → DEBATE → LOCK(L2/L3)
首先 invoke
skill 初始化状态管理文件。planning-with-files
- L2(自主模式): Claude 全自主完成,用户仅在升级时介入。
- L3(半交互模式): invoke
和brainstorming
让用户参与方案选择,DEBATE/LOCK 仍自主。writing-plans
- EXPLORE — 读取相关源文件、GitNexus 查执行流、识别可复用代码。发现即时写入 findings.md(2-action rule)
- PLAN — L2: 参考 brainstorming 原则自主提出多方案 | L3: invoke
交互式探索,再 invokebrainstorming
生成蓝图writing-plans - DEBATE — 提交蓝图给 Codex
xhigh 质询,最多 3 轮辩论--full-auto - LOCK — 冻结蓝图写入 task_plan.md,后续阶段不得偏离
详见 references/debate-protocol.md
Phase 1: EXECUTE
复用
codex-execute 的 Codex CLI 调用模式,增加蓝图注入:
codex exec --dangerously-bypass-approvals-and-sandbox -m gpt-5.4 -C "<dir>" "<task + 蓝图引用>"
Phase 2: REVIEW
| 层级 | 执行者 | 适用级别 |
|---|---|---|
| Layer 1 | Claude 初审 | 所有 |
| Layer 1.5 | 确定性验证(pytest/linter) | L2/L3 |
| Layer 2 | Codex 终审(蓝图 + diff) | L2/L3 |
| 交叉审查 | Codex 审查 Claude 的修正 | L3 必选,L2 可选 |
修复-重审循环:最多 3 轮(Layer 2 + 交叉审查共享全局预算)。退出:✅ Clean pass | 🟡 仅主观建议 | 🛑 3 轮上限 → 升级用户
模板运行独立 Pipeline(Phase A-F),不走上述标准层级。详见 review-protocol.md 的 Standalone Audit Pipeline 章节。audit
详见 references/review-protocol.md
Phase 3: REPORT
输出结构化报告 + 更新 progress.md。✅ 时自动
git commit;🛑 时不提交。
工作流分级
| 级别 | 触发条件 | Phase 0 | Phase 1 | Phase 2 | Phase 3 |
|---|---|---|---|---|---|
| L1 | 单文件, <30 行 | 跳过 | 单次 Codex | Claude 快审 | 简要摘要 |
| L2 | 多文件, 需上下文 | 完整 4 步 | 单次 Codex | 多层(3 轮) | 完整报告 |
| L3 | 架构级, 多模块 | 完整 4 步 | 多步 Codex | 多层+交叉审查 | 完整报告 |
分级判定: 当文件数和行数指向不同级别时(如单文件 >30 行),取更高级别。
预设模板
9 个模板:
code bugfix refactor test review audit optimize architect research
调用:
/crossfire <模板>: <描述> | /crossfire L2: <描述>
可选标志:
--no-debate | --no-audit | --inject-plan <dir>
详见 references/templates-and-faq.md
关键约束
- 模型 — 强制
(gpt-5.4
配置~/.codex/config.toml
)model_reasoning_effort = "xhigh" - 并发 — 同一时间只运行一个 Codex 实例
- 蓝图纪律 — Phase 1/2 不得静默偏离锁定蓝图
- 升级机制 — 辩论/审查达 3 轮上限或僵局时,必须升级给用户
- 临时文件 — 使用项目级
目录(需 .gitignore 排除),Phase 3 完成后清理.crossfire/ - 外部依赖 — Phase 0 委托的
、planning-with-files
、brainstorming
来自 superpowers 插件(已测试 v4.3.1+)writing-plans
Windows 防护层(强制执行)
所有 Codex 调用必须执行以下预处理,详见 references/templates-and-faq.md「Windows 防护层」:
| 防护层 | 规则 | 影响阶段 |
|---|---|---|
| 路径归一化 | 所有路径转正斜杠, 参数和 prompt 内文件引用均适用 | 全部 |
注入 | 每个 Codex prompt 第一行固定为 | 全部 |
| 蓝图内嵌 | 蓝图 ≤200 行时直接嵌入 prompt,>200 行时指示 Codex 读文件(减少 prompt 膨胀) | Phase 1 |
| 产出完整性兜底 | Codex 产出文件缺失或截断(超时/网络/异常)时,Claude 用 Write 完整覆盖 | Phase 1 |