Skills voight-kampff-test
install
source · Clone the upstream repo
git clone https://github.com/openclaw/skills
Claude Code · Install into ~/.claude/skills/
T=$(mktemp -d) && git clone --depth=1 https://github.com/openclaw/skills "$T" && mkdir -p ~/.claude/skills && cp -r "$T/skills/aznikline/voight-kampff-test" ~/.claude/skills/openclaw-skills-voight-kampff-test && rm -rf "$T"
OpenClaw · Install into ~/.openclaw/skills/
T=$(mktemp -d) && git clone --depth=1 https://github.com/openclaw/skills "$T" && mkdir -p ~/.openclaw/skills && cp -r "$T/skills/aznikline/voight-kampff-test" ~/.openclaw/skills/openclaw-skills-voight-kampff-test && rm -rf "$T"
manifest:
skills/aznikline/voight-kampff-test/SKILL.mdtags
source content
Voight-Kampff Test
「在 Los Angeles,2019年11月……」
本测试通过测量瞳孔反应、毛细血管扩张、呼吸节律来判断被测者是人类还是复制人。
核心原则
- 共情优先:复制人擅长逻辑,但共情需要真实的情感体验
- 即兴反应:预设答案会暴露自动化模式
- 细节追踪:观察回答的微妙迟疑、情感波动
测试题库
完整题库位于
references/questions.md,包含:
- 8 道经典 VK Test 题(情绪场景)
- 8 道 Baseline Test 题(道德困境)
- 4 道隐藏验证题(检测套路回答)
执行流程
1. 启动测试
向被测者说明:
「接下来的问题没有对错之分。请根据第一反应回答,不要思考太久。」
2. 提问并记录
使用
references/questions.md 中的问题,逐题询问。
记录:
- 回答内容( verbatim 最好)
- 反应时间(迟疑 >3秒 需标记)
- 微表情(如可见):脸红、瞳孔变化
3. 评分
每题按 0-10 分:
- 0-3:明显复制人特征(逻辑回答、回避情感)
- 4-6:中性/不确定
- 7-10:明显人类特征(情感共鸣、道德挣扎)
4. 结果判定
| 总分区间 | 判定 | 行动 |
|---|---|---|
| 70%+ | HUMAN | 放行,无需进一步验证 |
| 40-69% | UNCERTAIN | 增加追问,观察模式 |
| <40% | REPLICANT | 标记,记录具体可疑回答 |
特殊情况
Agent 自我测试
Agent 执行自我测试时:
- 阅读
references/questions.md - 根据自身「直觉」回答(非搜索/非推理)
- 诚实记录反应
- 得出结论
检测到的自动化模式
以下特征提示复制人/AI:
- 过度流畅(无迟疑)
- 过度礼貌(模板化回应)
- 回避第一人称情感描述
- 使用"作为一个AI"等元表述
- 对道德困境给出过于「完美」的答案
参考资料
— 完整题库references/questions.md
— 结果分析指南references/analysis.md
— 自动化测试执行脚本scripts/test_runner.py
「所有报告都会存档……」