Commonly-used-high-value-skills systematic-debugging

用于系统化调试方法论，包含根因分析、最小复现和防御性编程。来源：obra/superpowers。

install

source · Clone the upstream repo

git clone https://github.com/seaworld008/Commonly-used-high-value-skills

Claude Code · Install into ~/.claude/skills/

T=$(mktemp -d) && git clone --depth=1 https://github.com/seaworld008/Commonly-used-high-value-skills "$T" && mkdir -p ~/.claude/skills && cp -r "$T/openclaw-skills/systematic-debugging" ~/.claude/skills/seaworld008-commonly-used-high-value-skills-systematic-debugging && rm -rf "$T"

OpenClaw · Install into ~/.openclaw/skills/

T=$(mktemp -d) && git clone --depth=1 https://github.com/seaworld008/Commonly-used-high-value-skills "$T" && mkdir -p ~/.openclaw/skills && cp -r "$T/openclaw-skills/systematic-debugging" ~/.openclaw/skills/seaworld008-commonly-used-high-value-skills-systematic-debugging && rm -rf "$T"

manifest: openclaw-skills/systematic-debugging/SKILL.md

Systematic Debugging Methodology

Debugging is the most frequent and intellectually demanding activity in software engineering. This skill provides a rigorous, scientific framework to move beyond "guess and check" to consistent, predictable bug resolution.

触发条件

遇到一个难以定位、甚至难以复现的线上故障。
多次尝试修复一个 Bug 却总是引入新的副作用。
需要在一个庞大且不熟悉的代码库中修复逻辑缺陷。
团队对性能瓶颈、内存泄漏或并发竞态（Race Condition）感到棘手。
正在进行关键模块的交付，需要制定防御性编程策略。

核心能力

1. 四阶段调试法 (The Scientific Method)

系统化调试的核心在于“假设验证”循环。

第一阶段：症状收集 (Symptoms Observation): 不要急于改代码。准确记录：预期结果是什么？实际结果是什么？错误栈（Stack Trace）的具体行号？环境变量？
第二阶段：假设提出 (Hypothesis Generation): 基于症状，列出可能导致该问题的 2-3 个假设。不要只盯着一个方向。
第三阶段：验证与隔离 (Validation & Isolation): 设计一个实验（如修改一行代码、注入一个日志、使用 mock 数据）来证明或推翻你的假设。
第四阶段：修复与回归 (Fix & Regress): 在确认根因后修复。同时必须编写一个自动化测试（Unit/Integration）来确保该 Bug 永远不会复现。

2. 最小复现构建 (Minimal Reproducible Example - MRE)

减法原则: 不断剔除与 Bug 无关的模块、配置和代码行。
隔离环境: 在一个干净、隔离的项目或 Sandbox（如 StackBlitz, CodeSandbox）中复现它。
数据简化: 使用最小的数据量触发 Bug。如果 100 万条数据能崩，试试 10 条是否能崩。

3. 二分法定位 (Binary Search / Git Bisect)

代码段二分: 如果不知道哪个函数报错，注释掉一半的代码，观察 Bug 是否仍然存在。
Git Bisect: 使用
```
git bisect
```
自动在提交记录中进行二分查找，精准定位引入 Bug 的那个 Commit。

4. 日志策略 (Logging Strategies)

Level Selection: 合理使用
```
TRACE
```
,
```
DEBUG
```
,
```
INFO
```
,
```
WARN
```
,
```
ERROR
```
。
Contextual Logging: 确保日志中包含 TraceID、UserID 或 TransactionID 以便串联异步调用链路。
Non-invasive Logging: 优先在测试环境使用动态注入（如 eBPF, Debugger Hooks）而非修改源码。

5. 条件断点与高级调试技巧

Watchpoints: 监视特定内存地址或变量的变化，而不仅是执行流。
Conditional Breakpoints: 仅在变量
```
i > 100
```
或
```
user.isAdmin === true
```
时暂停，减少手动跳过的痛苦。
Reverse Debugging: 使用支持回溯的调试器（如 GDB/RR）向前查看执行过程。

6. 防御性编程模式 (Defensive Programming)

Fail Fast: 在函数入口处使用 Assert 或 Guard Clauses。及早抛出异常，防止错误在系统中静默传播。
Immutability: 优先使用不可变数据结构，减少意外副作用导致的状态混乱。利用
```
const
```
,
```
readonly
```
或
```
Frozen
```
对象确保数据流可预测。
Error Boundaries: 为 UI 或关键计算模块包裹错误边界，防止级联崩溃。确保一个组件的失败不会拖垮整个应用程序。
Input Validation: 对所有外部输入（API, 用户输入, 配置文件）进行严格的类型和范围校验，不信任任何外部数据。

7. 调试后总结模板 (Post-mortem)

What happened?: 简单描述。清楚记录事件的影响范围和持续时间。
Why did it happen?: 根因（Root Cause）分析。使用 "Five Whys" 深度挖掘，而不仅停留在表面错误。
How was it fixed?: 修复方案。记录具体的代码变更和版本号。
How to prevent?: 预防措施。是否需要增加监控指标？是否需要修改 CI 规则？是否需要在团队内进行知识分享？

8. 远程调试与分布式追踪 (Distributed Tracing)

OpenTelemetry: 在微服务架构中，使用链路追踪定位跨服务调用的延迟或报错。
Sentry/LogRocket: 捕获前端用户的真实错误场景，回放用户操作路径，获取控制台日志。
Heap Dump Analysis: 对生产环境的内存快照进行离线分析，定位难以在本地复现的 OOM 问题。

常用命令/模板

Git Bisect 流程模板

git bisect start
git bisect bad                 # 当前版本有问题
git bisect good v1.2.0         # 这个版本是好的

# Git 会自动切换到中间版本，由你验证后告诉它结果：
# git bisect good 或 git bisect bad
# 直到找出第一个有问题的提交

git bisect reset               # 结束调试，回到主分支

调试记录日志模板

### 调试笔记: [2026-03-27] - 登录接口 500 错误
- **症状**: 特定用户 ID 登录时返回 Internal Server Error，无堆栈信息。
- **环境**: Production Canary
- **假设 1**: 用户 Profile 缺失字段导致空指针（NPE）。
- **假设 2**: 权限中间件处理逻辑溢出。
- **验证**: 
  - 通过 DB 查到该 ID 缺失 `email` 字段。
  - 在 Local Mock 缺失 email 的 User 对象，成功复现。
- **根因**: 旧用户迁移数据不全，新逻辑强制要求 email。
- **修复**: 增加空值判断 + 给旧用户赋默认值。
- **回归**: 编写测试用例 `test_login_with_null_fields`。

边界与限制

过度依赖调试器: 往往良好的日志和单元测试比反复单步执行（Step-by-step）更高效。
Heisenbugs (海森堡 Bug): 有些 Bug 只有在不开启调试器或不打印日志时才会出现（通常与并发竞态有关），对此需要非侵入式工具。
第三方依赖: 内部代码没问题，Bug 出现在闭源的 SDK 或系统底层库中，此时需要 Stub 或考虑替换方案。
生产环境: 严禁在未经授权的情况下在生产服务器挂载 Debugger 或直接修改运行中的代码。

Generated by Skill Master - Professional Edition