Skills auto-test-skill
当用户明确要求"测试技能"、"运行 auto-test"或"进行批判性测试"时使用。通过多轮 A 轮批判性测试 + B 轮质量原则检查,系统化发现、记录、修复问题,并沉淀可追溯的 `plans/` 与 `tests/` 文档。⚠️ 不适用:用户只是想优化功能(应直接修改)、只是询问技能问题(应直接回答)、没有明确"测试"意图。
install
source · Clone the upstream repo
git clone https://github.com/huangwb8/skills
Claude Code · Install into ~/.claude/skills/
T=$(mktemp -d) && git clone --depth=1 https://github.com/huangwb8/skills "$T" && mkdir -p ~/.claude/skills && cp -r "$T/auto-test-skill" ~/.claude/skills/huangwb8-skills-auto-test-skill && rm -rf "$T"
manifest:
auto-test-skill/SKILL.mdsource content
auto-test-skill(批判性思维驱动的测试优化技能)
与 bensz-collect-bugs 的协作约定
- 因本 skill 设计缺陷导致的 bug,先用
规范记录到bensz-collect-bugs
,不要直接修改用户本地已安装的 skill 源码;若有 workaround,先记 bug,再继续完成任务。~/.bensz-skills/bugs/ - 只有用户明确要求“report bensz skills bugs”等公开上报时,才用本地
上传新增 bug 到gh
;不要 pull / clone 整个仓库。huangwb8/bensz-bugs
你要产出的东西
本 skill 的交付不是“口头建议”,而是一组可追溯的文件:
(目录位置以
config.yaml:directories 为准;默认 plans/ + tests/)
:A 轮问题分析与改进计划(每轮 1 份)plans/vYYYYMMDDHHMM.md
:A 轮测试会话目录(包含tests/vYYYYMMDDHHMM/
+TEST_PLAN.md
)TEST_REPORT.md
:B 轮质量原则检查报告(维度以plans/B轮-vYYYYMMDDHHMM.md
为准)config.yaml:b_round_check.dimensions
:B 轮验证会话目录(包含tests/B轮-vYYYYMMDDHHMM/
+TEST_PLAN.md
)TEST_REPORT.md
目录与命名规范
- 测试会话 ID:
(分钟级时间戳)vYYYYMMDDHHMM - 规划文档:默认放在
(以plans/
为准)config.yaml:directories.plans - 测试会话:默认放在
(以tests/
为准)config.yaml:directories.tests - B 轮统一加前缀:
B轮-
工作流程
概览
用户输入 ↓ [A轮 × N]:分析 → 计划 → 优化 → 轻量测试 ↓ B轮:质量原则检查 → 针对性优化 → 轻量验证 ↓ 完成(文档齐全 + 问题闭环)
A 轮测试(可重复 N 次)
A.1 初始化会话(生成测试 ID + 目录)
目标:创建本轮的
plans/ 与 tests/ 骨架。
推荐使用确定性脚本(避免 AI 每次手动拼目录/文件名):
# 方式1:在目标 skill 根目录内执行(--skill-root .) python3 /path/to/auto-test-skill/scripts/create_test_session.py --skill-root . --kind a --id vYYYYMMDDHHMM --create-plan # 方式2:在任意位置执行(--skill-root 指向目标 skill 根目录) python3 auto-test-skill/scripts/create_test_session.py --skill-root /path/to/target-skill --kind a --id vYYYYMMDDHHMM --create-plan
说明:
- 脚本会优先使用目标 skill 的
(如存在);否则回退到 auto-test-skill 自带的templates/
,确保对任意 skill 都可用。templates/
可省略(脚本自动生成--id
);如显式指定,必须为vYYYYMMDDHHMM
格式。vYYYYMMDDHHMM
最低要求:
与plans/
存在tests/
与tests/vYYYYMMDDHHMM/TEST_PLAN.md
存在 可选增强(推荐):tests/vYYYYMMDDHHMM/TEST_REPORT.md- 使用
自动生成--create-plan
的骨架(默认不覆盖)plans/vYYYYMMDDHHMM.md
A.2 批判性分析与计划生成(写入 plans/)
目标:使用批判性思维发现系统性问题,写成可执行计划,按 P0/P1/P2 排序。
输出:
plans/vYYYYMMDDHHMM.md
⚠️ 批判性思维是核心要求(不是可选项):
- 必须使用「刁钻角度」思考(详见
)references/CRITICAL_THINKING_GUIDE.md - 必须发现至少 3 个系统性问题(架构/过度设计/一致/安全)
- 禁止列出"不痛不痒"的表面问题(如"缺少注释"等 P2 级别问题不应占多数)
质量要求(强制):
- 每轮至少发现 10 个问题(P0 + P1 + P2 总和)
- 鼓励达到 15-20 个问题(深入挖掘)
- P0 + P1 占比必须 ≥ 60%(确保问题有价值)
- 系统性问题 ≥ 3 个(架构设计/过度设计/一致性/安全性)
核心要求:
- 独立评估原则(强制):
- 每轮 A 轮必须基于目标 skill 的当前工作状态独立分析
- 不查看上轮的
和plans/
文件,避免"确认偏差"与"路径依赖"tests/ - 每轮都是一次完整的、无偏见的系统性审查
- 审查范围(强制):
- 必须审查:
、SKILL.md
(核心工作文件)config.yaml - 必须审查目录:
、scripts/
、references/
、templates/
(如不存在可在计划中说明)assets/ - 排除范围:
、tests/
、plans/
、CHANGELOG.md
(测试产物、变更记录和用户文档,不属于 skill 的工作代码),以及README.md
中config.yaml
命中的文件a_round_check.independent_review.exclude_patterns - 审查方法:使用 Glob/Read/Grep(如
/rg
)对工作文件做全量扫描,确保不遗漏find
- 必须审查:
- 批判性聚焦:每轮选择 1-2 个聚焦维度(系统架构/过度设计/一致性/安全性/边缘情况/用户体验)
- 刁钻角度:必须使用至少一个刁钻角度(边缘情况/恶意输入/隐式假设/自我质疑/跨文件矛盾)
- 优先级依据:P0/P1/P2 必须有明确的判定标准
- P0: 阻塞性问题、安全风险、核心功能缺失、架构设计缺陷
- P1: 重要优化(过度设计/冗余/不一致)、功能增强、测试覆盖不足
- P2: 锦上添花、文档改进、后续迭代项
- 可追溯性:每个问题必须包含位置、现象、影响、修复建议、验证方法
- 建设性:每条建议必须可执行、有证据、有价值、可验证(详见
)references/CONSTRUCTIVE_SUGGESTION_GUIDELINES.md
批判性思维框架(必读):
⚠️ 核心文档,必须使用references/CRITICAL_THINKING_GUIDE.md- 框架 1: 系统视角思考(架构设计/过度设计/一致性)
- 框架 2: 刁钻角度思考(边缘情况/恶意输入/隐式假设/自我质疑)
- 框架 3: 问题质量标准(黄金公式 + 质量检查清单)
⚠️ 已简化,突出批判性思维要求references/A_ROUND_PLAN_TEMPLATE.md
问题挖掘技巧(辅助工具)references/ISSUE_DISCOVERY_TECHNIQUES.md
建设性建议标准references/CONSTRUCTIVE_SUGGESTION_GUIDELINES.md
反例库(快速识别常见问题)references/ANTI_PATTERNS_LIBRARY.md
A.3 执行优化与轻量测试(写入 tests/)
目标:按计划逐项修复,并用轻量测试验证。
输出:
tests/vYYYYMMDDHHMM/TEST_REPORT.md
轻量测试原则:
- 只验证“核心路径”与“本轮变更点”
- 每条结论必须有可复现证据(命令输出、文件、对比结果)
- 中间产物放入
,不污染主目录tests/vYYYYMMDDHHMM/_artifacts/
可选增强(推荐,确定性自检):
python3 auto-test-skill/scripts/verify_test_session.py --require-plan tests/vYYYYMMDDHHMM
A.4 是否进入下一轮
⚠️ 强制检查(必须满足才能进入下一轮):
- 本轮已提出至少 10 个问题(P0 + P1 + P2 总和)
- 如未达到,必须继续挖掘问题(使用
中的技巧)references/ISSUE_DISCOVERY_TECHNIQUES.md
进入下一轮 A 轮的条件(在满足强制检查的前提下):
- 用户指定的轮次数未完成
- 本轮问题(P0/P1/P2)已全部闭环:修复完成,并在
会话的tests/
中给出验证证据TEST_REPORT.md
注意:每轮 A 轮都是独立评估,不因“问题已解决”而提前终止;如用户指定 N 轮,则按 N 轮执行。
重要:A 轮结束后(无论多少轮),必须进入 B 轮质量检查,不得跳过。
B 轮质量原则检查(当前 8 项)
⚠️ 强制执行:B 轮质量检查是自动测试流程的强制性环节,除非用户明确要求跳过,否则不得省略。
B.1 产出质量检查报告(写入 plans/)
目标:对 A 轮后的最新状态做系统性质量检查。
输出:
plans/B轮-vYYYYMMDDHHMM.md
检查维度(以
config.yaml 的 b_round_check.dimensions 为准):
- 硬编码/AI 功能规划
- 冗余残留错误检查
- 安全性检查
- 过度设计检查
- 通用性检查
- 一致性检查
- 配置集中化检查:检查精确端(config.yaml)与模糊端(工作文档)是否完全分离,确保所有可配置参数集中在 config.yaml 作为单一真相来源
- SKILL.md 瘦身检查:检查 SKILL.md 是否过于冗长,应将详细内容模块化到
references/
模板:
templates/B_ROUND_CHECK_TEMPLATE.md
B.2 B 轮优化与验证(写入 tests/)
⚠️ 强制修复要求:
- B 轮发现的 所有 P0-P2 问题都必须处理(修复或明确说明不修复理由)
- P0 问题必须修复
- P1 问题必须修复(除非有合理理由)
- P2 问题应尽可能修复
- 每个修复必须有验证证据(命令输出、文件对比、测试结果)
- 修复后必须更新
CHANGELOG.md
验证报告必须包含:
- 修复清单:每个 P0-P2 问题的修复方案和证据
- 遗留问题:未修复问题及原因(无论优先级)
- 变更记录:更新目标 skill 的 CHANGELOG.md
可选增强(推荐,确定性自检):
python3 auto-test-skill/scripts/verify_test_session.py --require-plan tests/B轮-vYYYYMMDDHHMM
完成条件:
- P0 问题修复率 = 100%
- P1 问题修复率 = 100%(除非有合理的不修复理由)
- P2 问题修复率 ≥ 60%(鼓励全部修复)
- 所有修复都有可复现证据
目标:对 B 轮发现的所有问题(P0-P2)进行系统性修复并验证。
推荐创建独立会话目录:
python3 /path/to/auto-test-skill/scripts/create_test_session.py --skill-root . --kind b --id vYYYYMMDDHHMM --a-test-id vYYYYMMDDHHMM --create-plan
输出:
tests/B轮-vYYYYMMDDHHMM/TEST_REPORT.md
完成条件(验收)
- 用户指定的 A 轮次数已完成(或明确说明提前结束原因)
- B 轮质量检查已完成并形成报告(⚠️ 强制要求,参考
的config.yaml
)b_round_check.mandatory - 每轮 A 轮平均问题数量 ≥ 10 个(P0 + P1 + P2 总和)
- 每轮 P0 + P1 占比 ≥ 60%(确保问题有价值)
- 每轮系统性问题 ≥ 3 个(架构/过度设计/一致/安全)
- 关键问题(P0/P1)已闭环:计划 → 修复 → 证据 → 结论
- B 轮 P0 问题修复率 = 100%,P1 问题修复率 = 100%(或在报告中逐条说明不修复理由)
-
与plans/
结构完整且可追溯tests/ - 目标 skill 的
已更新CHANGELOG.md
可复用资源
- 配置:
config.yaml - 模板:
templates/- A 轮计划:
templates/OPTIMIZATION_PLAN_TEMPLATE.md - B 轮质量检查:
templates/B_ROUND_CHECK_TEMPLATE.md - Bug 报告:
templates/BUG_REPORT_TEMPLATE.md - 最终总结:
templates/FINAL_SUMMARY_TEMPLATE.md - 测试计划:
templates/TEST_PLAN_TEMPLATE.md - 测试报告:
templates/TEST_REPORT_TEMPLATE.md
- A 轮计划:
- 参考:
references/- 批判性思维指南:
⚠️ 核心文档,必须使用references/CRITICAL_THINKING_GUIDE.md - A 轮计划结构:
⚠️ 已简化,突出批判性思维references/A_ROUND_PLAN_TEMPLATE.md - 测试最佳实践:
references/TESTING_BEST_PRACTICES.md - 建设性建议标准:
references/CONSTRUCTIVE_SUGGESTION_GUIDELINES.md - 问题挖掘技巧:
references/ISSUE_DISCOVERY_TECHNIQUES.md - 反例库:
references/ANTI_PATTERNS_LIBRARY.md
- 批判性思维指南:
- 辅助脚本:
scripts/create_test_session.py - 辅助脚本:
scripts/verify_test_session.py