crossfire

Use when 需要多文件代码实现并要求异源模型(Claude + Codex)交叉审查,或架构方案需要对抗性质询验证。适用于大型编码任务的端到端协作,不适用于单文件小修改或纯数据处理。

install
source · Clone the upstream repo
git clone https://github.com/PlutoLei/crossfire
Claude Code · Install into ~/.claude/skills/
git clone --depth=1 https://github.com/PlutoLei/crossfire ~/.claude/skills/plutolei-crossfire-crossfire
manifest: SKILL.md
source content

/crossfire — Claude + Codex 交叉火力 Pipeline

核心理念

Claude Code (Opus 4.6) = Actor(架构师/审查员),Codex (GPT-5.4) = Executor + Critic(执行者/审计员)。异源模型交叉审查减少确认偏差——不同训练分布更可能发现对方盲区(arXiv:2602.03794)。Windows 环境下所有 Codex 调用需经过路径归一化预处理(详见 templates-and-faq.md「Windows 防护层」)。

角色模型职责
架构师Claude Opus 4.6探索、规划、审查、修复、决策
执行者Codex gpt-5.4编码实现、文件修改
审计员Codex gpt-5.4
--full-auto
架构质询(Phase 0)、代码终审(Phase 2)

Skill 委托策略

crossfire 是编排器,复用已有 skill 的能力而非重写逻辑。

阶段L2 委托方式L3 委托方式目标 Skill
Phase 0a EXPLOREinvokeinvoke
planning-with-files
— 自主状态管理(task_plan.md / findings.md / progress.md)
Phase 0a-0b 多方案参考原则invoke
brainstorming
— L2 参考多方案+YAGNI 原则;L3 invoke 交互式探索,用户参与方案选择
Phase 0b PLAN 蓝图参考格式invoke
writing-plans
— L2 参考蓝图模板格式;L3 invoke 交互式规划,用户确认蓝图
Phase 1 EXECUTE自有逻辑自有逻辑Codex CLI 调用 + 蓝图注入 + Windows 防护层(crossfire 自身实现)

独有逻辑(不委托,crossfire 自身实现):

  • Phase 0c DEBATE — Codex 质询蓝图
  • Phase 0d LOCK — 冻结蓝图
  • Phase 2 多层 REVIEW — Claude 初审 + Codex 终审 + 交叉审查
  • Phase 3 REPORT — 结构化报告 + 自动提交
  • 升级机制 — 3 轮上限 → 升级用户

何时使用

场景使用
大量代码编写的实现任务
需要异源模型审查提升质量
架构设计需要对抗性验证
简单单文件小修改❌ 直接用 Claude Code
纯数据处理、Notebook 开发

四阶段 Pipeline

L1:     Phase 1(EXECUTE) → Phase 2(Claude快审) → Phase 3(REPORT)
L2/L3:  Phase 0(EXPLORE→PLAN→DEBATE→LOCK) → Phase 1(EXECUTE) → Phase 2(多层REVIEW) → Phase 3(REPORT)

Phase 0: EXPLORE → PLAN → DEBATE → LOCK(L2/L3)

首先 invoke

planning-with-files
skill 初始化状态管理文件。

  • L2(自主模式): Claude 全自主完成,用户仅在升级时介入。
  • L3(半交互模式): invoke
    brainstorming
    writing-plans
    让用户参与方案选择,DEBATE/LOCK 仍自主。
  1. EXPLORE — 读取相关源文件、GitNexus 查执行流、识别可复用代码。发现即时写入 findings.md(2-action rule)
  2. PLAN — L2: 参考 brainstorming 原则自主提出多方案 | L3: invoke
    brainstorming
    交互式探索,再 invoke
    writing-plans
    生成蓝图
  3. DEBATE — 提交蓝图给 Codex
    --full-auto
    xhigh 质询,最多 3 轮辩论
  4. LOCK — 冻结蓝图写入 task_plan.md,后续阶段不得偏离

详见 references/debate-protocol.md

Phase 1: EXECUTE

复用

codex-execute
的 Codex CLI 调用模式,增加蓝图注入:

codex exec --dangerously-bypass-approvals-and-sandbox -m gpt-5.4 -C "<dir>" "<task + 蓝图引用>"

Phase 2: REVIEW

层级执行者适用级别
Layer 1Claude 初审所有
Layer 1.5确定性验证(pytest/linter)L2/L3
Layer 2Codex
--full-auto
终审(蓝图 + diff)
L2/L3
交叉审查Codex 审查 Claude 的修正L3 必选,L2 可选

修复-重审循环:最多 3 轮(Layer 2 + 交叉审查共享全局预算)。退出:✅ Clean pass | 🟡 仅主观建议 | 🛑 3 轮上限 → 升级用户

audit
模板运行独立 Pipeline(Phase A-F),不走上述标准层级。详见 review-protocol.md 的 Standalone Audit Pipeline 章节。

详见 references/review-protocol.md

Phase 3: REPORT

输出结构化报告 + 更新 progress.md。✅ 时自动

git commit
;🛑 时不提交。


工作流分级

级别触发条件Phase 0Phase 1Phase 2Phase 3
L1单文件, <30 行跳过单次 CodexClaude 快审简要摘要
L2多文件, 需上下文完整 4 步单次 Codex多层(3 轮)完整报告
L3架构级, 多模块完整 4 步多步 Codex多层+交叉审查完整报告

分级判定: 当文件数和行数指向不同级别时(如单文件 >30 行),取更高级别。

预设模板

9 个模板:

code
bugfix
refactor
test
review
audit
optimize
architect
research

调用:

/crossfire <模板>: <描述>
|
/crossfire L2: <描述>

可选标志:

--no-debate
|
--no-audit
|
--inject-plan <dir>

详见 references/templates-and-faq.md


关键约束

  • 模型 — 强制
    gpt-5.4
    ~/.codex/config.toml
    配置
    model_reasoning_effort = "xhigh"
  • 并发 — 同一时间只运行一个 Codex 实例
  • 蓝图纪律 — Phase 1/2 不得静默偏离锁定蓝图
  • 升级机制 — 辩论/审查达 3 轮上限或僵局时,必须升级给用户
  • 临时文件 — 使用项目级
    .crossfire/
    目录(需 .gitignore 排除),Phase 3 完成后清理
  • 外部依赖 — Phase 0 委托的
    planning-with-files
    brainstorming
    writing-plans
    来自 superpowers 插件(已测试 v4.3.1+)

Windows 防护层(强制执行)

所有 Codex 调用必须执行以下预处理,详见 references/templates-and-faq.md「Windows 防护层」:

防护层规则影响阶段
路径归一化所有路径转正斜杠,
-C
参数和 prompt 内文件引用均适用
全部
cd
注入
每个 Codex prompt 第一行固定为
cd <归一化绝对路径>
全部
蓝图内嵌蓝图 ≤200 行时直接嵌入 prompt,>200 行时指示 Codex 读文件(减少 prompt 膨胀)Phase 1
产出完整性兜底Codex 产出文件缺失或截断(超时/网络/异常)时,Claude 用 Write 完整覆盖Phase 1