Agent-almanac forage-resources

install

source · Clone the upstream repo

git clone https://github.com/pjt222/agent-almanac

Claude Code · Install into ~/.claude/skills/

T=$(mktemp -d) && git clone --depth=1 https://github.com/pjt222/agent-almanac "$T" && mkdir -p ~/.claude/skills && cp -r "$T/i18n/ja/skills/forage-resources" ~/.claude/skills/pjt222-agent-almanac-forage-resources-00e4bb && rm -rf "$T"

manifest: i18n/ja/skills/forage-resources/SKILL.md

source content

リソースの採餌

採餌理論とアリのコロニー最適化を適用して、分散リソースを体系的に探索、評価、活用する — 未知の領域の探索と既知の収穫の活用をバランスさせる。

使用タイミング

総当たり列挙が実用的でない大きな解空間を探索する時
新しいアプローチの探索と既知の良好なものの深掘りの間で投資をバランスする時
複数の不確実な機会にわたるリソース配分を最適化する時
分散チームまたは自動エージェントの探索戦略を設計する時
早期収束（局所最適に固着）または永続的な放浪（コミットしない）を診断する時
```
coordinate-swarm
```
を特定のリソース発見パターンで補完する時

入力

必須: 探索するリソースの説明（情報、計算資源、人材、ソリューション、機会）
必須: 探索空間の説明（サイズ、構造、既知の特徴）
任意: 現在の探索戦略とその失敗モード
任意: 利用可能なスカウト/探索者の数
任意: 探索コスト vs. 活用失敗のコスト
任意: 時間軸（短期的活用 vs. 長期的探索）

手順

ステップ1: 採餌景観のマッピング

適切な採餌戦略を選択するためにリソース環境を特性化する。

リソースタイプとその分布を特定する：
- 集中型: リソースが豊富なパッチに集まる（例：特定のコミュニティの人材）
- 分散型: リソースが均等に広がる（例：コードベース全体のバグ）
- 一時的: リソースが出現し消失する（例：市場機会）
- 入れ子型: 豊富なパッチが異なるスケールのサブパッチを含む
情報景観を評価する：
- 採餌開始前にリソースの位置についてどの程度わかっているか？
- スカウトは採餌者と情報を共有できるか？（シグナル設計については
```
coordinate-swarm
```
  参照）
- 採餌中に景観は静的か変化しているか？
コスト構造を決定する：
- スカウト1体あたりの配置コスト（時間、計算資源、費用）
- 低品質リソースを活用するコスト（機会費用）
- 高品質リソースを見逃すコスト（後悔）

期待結果: リソース分布タイプ、情報の利用可能性、コスト構造が特性化された採餌景観。これがどの採餌モデルを適用するかを決定する。

失敗時: 景観が完全に未知の場合、初期マップを構築するために固定時間予算で最大探索（全スカウト、活用なし）から始める。景観の特性が明らかになったら適切なモデルに切り替える。

ステップ2: トレイルマーキング付きスカウトの配置

発見物をマークする指示を持つ探索エージェントを探索空間に送る。

スカウト割合を配分する（利用可能なエージェントの20-30%をスカウトとして開始）
スカウト行動を定義する：
- ランダム化または体系的パターンで探索空間を移動する
- 遭遇した各場所を評価する（簡易評価、深い分析ではない）
- 品質に比例したシグナル強度で発見をマークする：
  - 高品質 → 強いトレイルシグナル
  - 中品質 → 中程度のシグナル
  - 低品質 → 弱いシグナルまたはシグナルなし
- 情報を集団に返す（シグナル蓄積、レポート、ブロードキャスト）
スカウトパターンを設計する：
- ランダムウォーク: 未知の均一景観に適する
- レヴィフライト: 時折の局所クラスタリングを伴う長距離ジャンプ — パッチ状リソースに適する
- 体系的スイープ: グリッドまたはスパイラル — 限定された明確な空間に適する
- バイアスランダム: 以前の発見に類似した領域に傾く — クラスタ化リソースに適する

期待結果: 探索空間全体にスカウトが配置され、リソース品質に比例したトレイルシグナルを蓄積。スカウト報告から景観の初期マップが出現し始める。

失敗時: 初期スイープでスカウトが何も見つからない場合、スカウト割合が低すぎるか（50%に増加）、探索パターンが誤っているか（パッチ状リソースにはランダムウォークからレヴィフライトに切り替え）、品質評価のキャリブレーションが誤っている（検出閾値を下げる）。

ステップ3: トレイル強化の確立

成功したパスを増幅し、失敗したものを減衰させる正のフィードバックループを作成する。

採餌者がトレイルに従い良いリソースを見つけた場合：
- トレイルシグナルを強化する（強度を増加）
- 強化されたシグナルがより多くの採餌者を引きつける → さらなる強化 → 活用
採餌者がトレイルに従い何も見つからなかった場合：
- 強化しない（トレイルを自然に減衰させる）
- 弱まるシグナルがより少ない採餌者を引きつける → トレイルが消える → 探索が再開
強化パラメータを設定する：
- 蓄積量: 見つかったリソース品質に比例
- 減衰率: トレイルが時間単位あたりX%の強度を失う
- 飽和上限: 最大トレイル強度（単一パスの暴走的活用を防ぐ）

Trail Reinforcement Dynamics:
┌─────────────────────────────────────────────────────────────────────┐
│                                                                     │
│  Strong trail ──→ More foragers ──→ If good: reinforce ──→ EXPLOIT │
│       ↑                                                      │      │
│       │                              If bad: no reinforce    │      │
│       │                                     │                │      │
│       │                                     ↓                │      │
│  Decay ←── Weak trail ←── Fewer foragers ←── Trail fades    │      │
│       │                                                      │      │
│       ↓                                                      │      │
│  No trail ──→ Scouts explore ──→ New discovery ──→ New trail ↗      │
│                                                                     │
└─────────────────────────────────────────────────────────────────────┘

期待結果: 良いリソースが注目を集め、貧弱なリソースが自然に放棄される自己調整フィードバックループ。システムがトレイルダイナミクスだけで活用と探索をバランスする。

失敗時: すべての採餌者が単一のトレイルに収束する場合（早期収束）、減衰率が遅すぎるか飽和上限が高すぎる。減衰を増加、上限を下げる、またはランダム探索の義務を導入する（例：採餌者の10%が常にトレイルを無視）。トレイルが速く消えすぎて何も活用されない場合、減衰率を下げる。

ステップ4: 収穫逓減の検出

活用から探索に戻すタイミングを知るためにリソース収穫を監視する。

各アクティブな採餌サイトの努力単位あたりの収穫を追跡する：
- 収穫増加 → 健全な活用、継続
- 収穫横ばい → 飽和に近づいている、代替のスカウティングを開始
- 収穫減少 → 収穫逓減、採餌者を減らしスカウトを増やす
限界値定理を実装する：
- 現在のサイトの収穫率を全既知サイトの平均収穫率と比較
- 現在のサイトが平均を下回ったら、離れる時
- 移動コスト（新しいサイトへの切り替えコスト）を考慮する
以下の場合にスカウティングウェーブをトリガーする：
- 全サイトの全体的な収穫が閾値を下回った
- 最もパフォーマンスの良いサイトの活用が予想寿命を超えて続いている
- 環境変化が検出された（未探索領域のスカウトからの新しいシグナル）

期待結果: 採餌群が任意のスケジュールではなく収穫モニタリングに基づいて、活用フェーズ（既知の良好なサイトに集中）と探索フェーズ（スカウト分散）を自然に切り替える。

失敗時: 群が枯渇したサイトに長く留まりすぎる場合、限界値閾値が低すぎるか移動コスト推定が高すぎる。実際の収穫率を比較して再キャリブレーションする。群が良いサイトを早く放棄しすぎる場合、閾値が敏感すぎる — 収穫測定にスムージングウィンドウを追加する。

ステップ5: 条件に応じた採餌戦略の適応

環境フィードバックに基づいて採餌戦略を選択し切り替える。

戦略を景観に合わせる：
- 豊富でクラスタ化: 発見されたパッチに大量にコミット（高活用）
- 疎でまばら: 高いスカウト比率を維持（高探索）
- 変動的で変化する: 短いトレイル減衰、頻繁なスカウティングウェーブ（適応型）
- 競争的: 速い強化、先制的トレイルマーキング（縄張り型）
戦略-環境の不一致を監視する：
- 高努力、低収穫 → 景観に対して戦略が活用的すぎる
- 高発見率、低フォロースルー → 戦略が探索的すぎる
- 収穫の振動 → 戦略の切り替えが攻撃的すぎる
適応的切り替えを実装する：
- 探索対活用比率のローリング平均を追跡する
- 比率が最適値（景観タイプにより決定）から大きくずれた場合、押し戻す
- 段階的な移行を許容する — 急な戦略切り替えは調整の混乱を引き起こす

期待結果: 条件が変化しても効果を維持しながら、現在の環境に探索-活用バランスを適応させる採餌システム。

失敗時: 戦略適応自体が不安定になる場合（探索と活用の間で振動）、ダンピングを追加する：戦略シフトをトリガーする前に不一致シグナルがN時間単位持続することを要求する。どの戦略もうまくいかない場合、ステップ1の景観特性を再評価する — リソース分布が当初の想定より複雑かもしれない。

バリデーション

採餌景観が特性化されている（分布タイプ、情報の利用可能性、コスト構造）
スカウト割合と探索パターンが定義され配置されている
トレイル強化ループが蓄積、減衰、飽和パラメータで機能している
収穫逓減の検出が活用から探索への再バランスをトリガーする
戦略-環境の適合が監視され適応的切り替えが設定されている
システムが景観の変化（新しいリソース、枯渇したリソース）から回復する

よくある落とし穴

早期収束: すべての採餌者が最初の良い発見に群がり、潜在的により良い選択肢を無視する。対策：必須探索割合、トレイル飽和上限、減衰
永続的探索: スカウトが新しい選択肢を見つけ続けるが群がコミットしない。対策：トレイル強化の品質閾値を下げる、スカウト割合を減らす
移動コストの無視: サイト切り替えにはコストがある。類似品質のサイト間を常にジャンプする採餌者は獲得以上を移動に浪費する。限界値計算に移動コストを組み込む
動的景観での静的戦略: 昨日の条件に最適化された戦略は明日失敗する。適応を後付けではなく採餌ループに組み込む
スカウト品質と採餌者品質の混同: 良いスカウト（広く、迅速な評価）と良い採餌者（深く、徹底的な活用）は異なるスキルを必要とする。すべてのエージェントに両方の役割を強制しない