Skills self-heal-watchdog
install
source · Clone the upstream repo
git clone https://github.com/openclaw/skills
Claude Code · Install into ~/.claude/skills/
T=$(mktemp -d) && git clone --depth=1 https://github.com/openclaw/skills "$T" && mkdir -p ~/.claude/skills && cp -r "$T/skills/bptravel2017/self-heal-watchdog" ~/.claude/skills/clawdbot-skills-self-heal-watchdog && rm -rf "$T"
manifest:
skills/bptravel2017/self-heal-watchdog/SKILL.mdsource content
Self-Heal Watchdog 🛡️
三层自愈保护系统,监控 OpenClaw Gateway 进程、配置完整性和模型响应。
安装
bash skills/self-heal-watchdog/scripts/setup.sh
使用 launchd(macOS 原生调度器),每 60 秒运行一次。
手动命令
| 命令 | 说明 |
|---|---|
| 查看当前状态和最近日志 |
| 查看完整日志 |
| 手动运行一次看门狗 |
| 干运行(不执行任何操作) |
| 手动触发模型切换 |
| 卸载看门狗 |
三层保护
1. Process Watchdog
每分钟检测 gateway 进程是否存活,崩溃自动 restart。
2. Config Guard
每次检查前备份
~/.openclaw/openclaw.json,配置损坏自动回滚。
3. Model Health Check
通过
/health 端点检测模型响应,连续 2 次失败自动切换 fallback 模型。
文件说明
| 文件 | 用途 |
|---|---|
| 主脚本(cron 每分钟调用) |
| 健康检查逻辑 |
| 模型切换逻辑 |
| 安装/卸载 |
| 状态查看 |
配置
- 状态文件:
~/.openclaw/watchdog-state.json - 日志文件:
~/.openclaw/watchdog/watchdog.log - Gateway URL:
http://localhost:18789 - 检查间隔: 1 分钟(cron)
- 失败阈值: 连续 2 次触发 failover
安全
- 所有脚本仅监听 localhost
- 不记录 API key/token
- 日志自动轮转(保留 1000 行)
- 修改配置前先备份