Skills superpowers-tdd
Use when implementing any feature or bugfix, before writing implementation code - enforces RED-GREEN-REFACTOR cycle: write failing test first, verify it fails, write minimal code, verify it passes, then refactor
install
source · Clone the upstream repo
git clone https://github.com/openclaw/skills
Claude Code · Install into ~/.claude/skills/
T=$(mktemp -d) && git clone --depth=1 https://github.com/openclaw/skills "$T" && mkdir -p ~/.claude/skills && cp -r "$T/skills/axelhu/superpowers-tdd" ~/.claude/skills/clawdbot-skills-superpowers-tdd && rm -rf "$T"
manifest:
skills/axelhu/superpowers-tdd/SKILL.mdsource content
Superpowers TDD - 测试驱动开发
核心准则
先写测试,看着它失败,写最少的代码让它通过。
如果没看过测试失败,就不知道测试的是不是对的东西。
违反规则的字面意思 = 违反规则的精神。
铁律
没有失败的测试,就不能写生产代码 先写代码后写测试?删除它。从头开始。
没有例外:
- 不要留着当"参考"
- 不要在写测试时"改编"它
- 不要看它
- 删除就是删除
红-绿-重构循环
RED - 写失败的测试
写一个最小测试,展示应该发生什么。
# Good: 清晰名称,测试真实行为,一件事 def test_retries_failed_operations_3_times(): attempts = 0 def operation(): nonlocal attempts attempts += 1 if attempts < 3: raise Exception('fail') return 'success' result = retry_operation(operation) assert result == 'success' assert attempts == 3
❌ Bad: 模糊名称,测试 mock 而不是真实代码 def test_retry_works(): mock = MagicMock() mock.side_effect = [Exception(), Exception(), 'success']
要求:
- 一个行为
- 清晰名称
- 真实代码(除非不可避免才用 mock)
验证 RED - 看着它失败
必须执行,从不跳过。
pytest tests/path/test_name.py -v # 或项目对应的测试命令
确认:
- 测试失败(不是错误)
- 失败信息符合预期
- 失败是因为功能缺失(不是拼写错误)
测试通过了? 你在测试已有行为。修复测试。
GREEN - 最少代码
写最简单的代码让测试通过。
# Good: 刚好够通过测试 def retry_operation(fn, max_retries=3): for i in range(max_retries): try: return fn() except Exception as e: if i == max_retries - 1: raise e
❌ Bad: 过度设计,加入了测试没要求的功能 def retry_operation(fn, options={max_retries=3, backoff='linear', onRetry=...}) # YAGNI - 你不需要这个
不要添加功能、不要重构其他代码、不要"改进"超过测试要求。
验证 GREEN - 看着它通过
必须执行。
pytest tests/path/test_name.py -v
确认:
- 测试通过
- 其他测试仍然通过
- 输出干净(无错误、无警告)
测试失败? 修代码,不是测试。
其他测试失败? 立刻修。
REFACTOR - 重构
只有在 green 之后:
- 移除重复
- 改进名称
- 提取辅助函数
保持测试 green。不添加行为。
重复
下一个失败测试对应下一个功能。
好测试的特征
| 质量 | 好 | 坏 |
|---|---|---|
| 最小 | 一件事。名称里有"and"?拆开它。 | |
| 清晰 | 名称描述行为 | |
| 展示意图 | 展示期望的 API | 掩盖代码应该做什么 |
常见借口(别信)
| 借口 | 现实 |
|---|---|
| "太简单了不用测" | 简单代码也会坏。测试只用30秒。 |
| "我之后测" | 测试立即通过什么也证明不了。 |
| "之后测试也能达到同样目标" | 之后测试 = "这代码干了什么?" 先写测试 = "这代码应该干什么?" |
| "我已经手动测试了" | 手动测试是随意的。没有记录,不能重跑。 |
| "删除 X 小时的工作太浪费" | 沉没成本谬误。留着不可信的代码是技术债。 |
| "留着当参考" | 你会改编它。那就是之后测试。删除就是删除。 |
| "TDD 太教条" | TDD 是务实的:比事后调试快。 |
红旗 - 停止并从头开始
- 先写代码后写测试
- 实现之后才写测试
- 测试立即通过
- 说不清为什么测试失败
- "之后"添加的测试
- 合理化"就这一次"
- "我已经手动测试了"
- "之后测试能达到同样目的"
- "这是精神不是仪式"
- "留着当参考"或"改编现有代码"
所有这些意味着:删除代码。从头用 TDD。
Bug 修复示例
Bug: 空邮箱被接受
RED
def test_rejects_empty_email(): result = submit_form({'email': ''}) assert result['error'] == 'Email required'
Verify RED
$ pytest FAIL: expected 'Email required', got undefined
GREEN
def submit_form(data): if not data.get('email', '').strip(): return {'error': 'Email required'} # ...
Verify GREEN
$ pytest PASS
REFACTOR 如需要可提取多字段验证。
完成前检查表
- 每个新函数/方法都有测试
- 实现前看过每个测试失败
- 每个测试失败原因符合预期(功能缺失,不是 typo)
- 写了最少的代码让每个测试通过
- 所有测试通过
- 输出干净(无错误、无警告)
- 测试使用真实代码(除非不可避免才用 mock)
- 覆盖了边界情况和错误
不能全部打勾?跳过了 TDD。从头开始。