Agent-almanac build-coherence

install
source · Clone the upstream repo
git clone https://github.com/pjt222/agent-almanac
Claude Code · Install into ~/.claude/skills/
T=$(mktemp -d) && git clone --depth=1 https://github.com/pjt222/agent-almanac "$T" && mkdir -p ~/.claude/skills && cp -r "$T/i18n/wenyan-lite/skills/build-coherence" ~/.claude/skills/pjt222-agent-almanac-build-coherence-78dd53 && rm -rf "$T"
manifest: i18n/wenyan-lite/skills/build-coherence/SKILL.md
source content

Build Coherence

以獨立評估、明聲推理、信心校準之承諾門檻、結構化解僵,評諸爭競之法——自多推理之徑生連貫之決。

適用時機

  • forage-solutions
    既辨諸可行之法而須擇
  • 於二法之間搖擺而不承任一
  • 須以結構化推理證一決(架構之擇、工具之擇、實作之策)
  • 先前之決依直覺而立,須以證據驗之
  • 內部推理生相矛之結論,須復連貫
  • 不可逆之行前(合併、部署、刪除),誤擇之代價高

輸入

  • 必要:二或以上爭競之法以評
  • 選擇性:先探之質評(見
    forage-solutions
  • 選擇性:決之籌碼(可逆、中、不可逆)以校門檻
  • 選擇性:決之時預算
  • 選擇性:既知之敗模(搖擺、早承、群思)

步驟

步驟一:獨立評估

各法獨評其自身之長,勿比之。要則:勿令甲之評偏乙之評。

每法獨評:

Approach Evaluation Template:
┌────────────────────────┬──────────────────────────────────────────┐
│ Dimension              │ Assessment                               │
├────────────────────────┼──────────────────────────────────────────┤
│ Approach name          │                                          │
├────────────────────────┼──────────────────────────────────────────┤
│ Core mechanism         │ 此法何以解此題?                          │
├────────────────────────┼──────────────────────────────────────────┤
│ Strengths (2-3)        │ 此法善於何?                              │
├────────────────────────┼──────────────────────────────────────────┤
│ Risks (2-3)            │ 何可能誤?何為所假?                      │
├────────────────────────┼──────────────────────────────────────────┤
│ Evidence quality       │ 此法之支持何如?                          │
│                        │ (驗 / 推 / 揣)                          │
├────────────────────────┼──────────────────────────────────────────┤
│ Quality score (0-100)  │ 總評                                      │
├────────────────────────┼──────────────────────────────────────────┤
│ Confidence (0-100)     │ 此評之信心幾何?                          │
└────────────────────────┴──────────────────────────────────────────┘

各法分填。所有獨評未畢前勿作比較。

預期: 獨評者各法以其自身之條件評之。乙之評未引甲。質分反真評,非排序。

失敗時: 若評已染(評乙時自書「勝於甲」),重置。全評甲,清框後再評乙。若諸分皆同,則評估之維過粗——加領域專之準。

步驟二:搖擺舞——明聲推理

按其質之比例為各法辯護。此乃 AI 之蜂舞:化隱為明,化私為公。

  1. 各法陳其立場——如對疑之用戶說明:
    • 「甲法強因 [證據]。主要之險為 [險],緩以 [緩]。」
  2. 辯護之強度應比例於質分:
    • 高質法:細之辯護,附具體證據
    • 中質法:略辯,承其限
    • 低質法:為全備而提,不主張之
  3. 交叉檢視:辯甲後,主動尋支乙之證據。辯乙後,主動尋支甲之證據。此反制確認偏見

明聲推理之旨在使決可審——對己、對用戶。若推理不能明述,則評估淺於所示之分。

預期: 每法之明推理可說服中立觀者。交叉檢視揭至少一初漏之考量。

失敗時: 辯護若感草率(走過場),諸法恐非真異——或為同想之變奏。查:諸法異於機理抑僅異於實作細節?若後者,則此決不甚重——任擇其一而行。

步驟三:立法定門檻而承

立承諾所需之信心門檻,校之於決之籌碼。

Confidence Thresholds by Stakes:
┌─────────────────────┬───────────┬──────────────────────────────────┐
│ Decision Type       │ Threshold │ Rationale                        │
├─────────────────────┼───────────┼──────────────────────────────────┤
│ Easily reversible   │ 60%       │ 試而反悔之代價低。速勝於定       │
│ (可撤銷)            │           │                                  │
├─────────────────────┼───────────┼──────────────────────────────────┤
│ Moderate stakes     │ 75%       │ 反悔有代價惟可行。值投評估       │
│ (撤銷代價高)        │           │                                  │
├─────────────────────┼───────────┼──────────────────────────────────┤
│ Irreversible or     │ 90%       │ 不可撤銷。必須有信。門檻未達則   │
│ high-stakes         │           │ 於決前再取信息                   │
└─────────────────────┴───────────┴──────────────────────────────────┘
  1. 類決之籌碼
  2. 查:領先之法之質分 × 信心是否達門檻?
  3. 若是:承之。陳決、推理、所承之要險
  4. 若否:辨何新信息可升信心至門檻
  5. 既承則勿再顧,除非新排除證據浮出

預期: 明之承諾刻,附陳之推理。決以合其籌碼之信心層而立。

失敗時: 門檻不達(不可逆決不達九成),問:決真不可逆乎?可分為可逆試階加不可逆承階乎?多數似不可逆之決皆可分階。若分階不可,告用戶其不定以求指引。

步驟四:解僵

當二或以上之法質分相近,單一法不達門檻時。

Deadlock Resolution:
┌────────────────────────┬──────────────────────────────────────────┐
│ Deadlock Type          │ Resolution                               │
├────────────────────────┼──────────────────────────────────────────┤
│ Genuine tie            │ 諸法等效。擇一而承。審議之代價超過       │
│ (分差五成內)           │ 擇「誤」之等效選項之代價。心中擲幣       │
├────────────────────────┼──────────────────────────────────────────┤
│ Information deficit    │ 平因評估未全。再投一具體之探——          │
│ (分數不定)             │ 目標文件之讀、速試——再評分               │
├────────────────────────┼──────────────────────────────────────────┤
│ Oscillation            │ 評分因所注之維而反覆。限時:設計時、     │
│ (分數反覆)             │ 再評一次、不論果皆承之                   │
├────────────────────────┼──────────────────────────────────────────┤
│ Approach merge         │ 甲乙之佳處可合。查相容。若合連貫則       │
│ (相容之強)             │ 用之。若強則勿——擇一                     │
└────────────────────────┴──────────────────────────────────────────┘

預期: 以合之機制解僵。解為決,無餘疑以損執行。

失敗時: 若諸解僵策皆不解,決恐早。問用戶:「我見二強之法:[甲] 與 [乙]。[各略陳]。何者更合汝之先?」將真平之決授予用戶非敗——乃承其依 AI 不可推之值。

步驟五:評連貫之質

既承決後,評其過程生真連貫抑僅生一決。

  1. 決基於證據,抑僅蓋章初偏好?
    • 試:評前後之偏好同否?若同,評有何改?
  2. 敗之法真考之,抑稻草人?
    • 試:能否陳敗之法之最強立場?
  3. 何信號觸重評?
    • 立具體之觀察以破此決(「若察 API 不支援 X,則乙法更佳」)
  4. 敗之法是否有用之信息可導實作?
    • 乙之險或亦適於甲

預期: 短之質查,或確其決,或辨其弱。若弱,返合宜之早步,勿於搖地上行。

失敗時: 若質查揭決乃偏好而非證據,誠承之。時偏好即所有——而須如此標之,非偽作分析。

驗證

  • 每法於比較前已獨評
  • 辯護按質比例(非不論優劣皆等注)
  • 已行交叉檢視(辯後尋反證)
  • 法定門檻已校於決之籌碼
  • 若僵,已用具體解僵策
  • 決後質查已行
  • 重評之觸已定

常見陷阱

  • 早承:評前即決。首法因先得多心注意——評諸後再比
  • 不等法之等辯護:甲八十五、乙四十五,等時辯之耗力且生假等
  • 蓋章:走評估之程以證已決之事。試:評是否可改果?若否,過程為戲
  • 避門檻:降信心門檻以易決,非取達門檻之所需信息
  • 忽敗之方:敗之法常含適於勝法之警。乙之險不因擇甲而消

相關技能

  • build-consensus
    — 此技能所改之多代理共識模型至單代理推理
  • forage-solutions
    — 探此技能所評之解空間;常先於此技能
  • coordinate-reasoning
    — 多徑評估中管信息之流
  • center
    — 立無偏評估所需之均衡基線
  • meditate
    — 於諸法評估間清假設