Immortal-skill distill-shield

Distill Shield:为个人移交资料包生成 Canary 与可选加固策略,提高未授权蒸馏成本;仅适用于有权处置的数据。

install
source · Clone the upstream repo
git clone https://github.com/agenmod/immortal-skill
Claude Code · Install into ~/.claude/skills/
T=$(mktemp -d) && git clone --depth=1 https://github.com/agenmod/immortal-skill "$T" && mkdir -p ~/.claude/skills && cp -r "$T/distill-shield-skill" ~/.claude/skills/agenmod-immortal-skill-distill-shield && rm -rf "$T"
manifest: distill-shield-skill/SKILL.md
source content

复制给 AI

  • 本 Skill 唯一入口:当前文件
    distill-shield-skill/SKILL.md
  • 仓库根:假定
    immortal-skill/
    (或含本目录与
    kit/
    的克隆根)。
  • 从仓库根运行生成脚本(推荐,避免路径歧义):
python3 distill-shield-skill/kit/shield_gen.py --output ./handover-bundle --label "我的移交包"

Distill Shield

语言

根据用户第一条消息的语言,全程使用同一语言。

何时激活

  • 用户要「防蒸馏」「加固资料包」「移交前埋 Canary」。
  • 用户运行
    kit/shield_gen.py
    后需要根据输出做伦理与可读性检查。

伦理红线

  • 对本人或已获授权的数据使用;禁止对他人资料恶意投毒。
  • 不承诺数学上不可攻破;承诺 可检测性、审计成本、部分管线干扰

路径约定

  • 本 Skill 根目录
    {baseDir}
    =
    distill-shield-skill/

操作顺序

Phase 0:威胁模型

  • 蒸馏场景:一次性 LLM 蒸馏 vs 批量训练 vs 仅人类阅读?
  • 接收方:家人 / 律师 / 公司?(决定策略强度)

Phase 1:材料盘点

  • 格式、是否分块检索、是否经 OCR。

Phase 2:策略选择(准则)

策略对人对自动化管线可被绕过
Canary 唯一字符串低影响(可放附录)泄露时可检索剔除后丢失
提示注入段需标注阅读区可能干扰单次 LLM 蒸馏预处理可剥离
矛盾样本可能困惑读者污染蒸馏一致性人工可识别

Phase 3:生成

distill-shield-skill/
目录内时:

python3 kit/shield_gen.py --output ./handover-bundle --label "我的移交包"

仓库根(推荐,与「复制给 AI」一致):

python3 distill-shield-skill/kit/shield_gen.py --output ./handover-bundle --label "我的移交包"

将生成的

CANARY.txt
与说明合并进实际交付目录。

Phase 4:自检清单

  • 第三方隐私已脱敏
  • Canary 已记录在安全处(便于日后比对)
  • 人类读者能看懂「附录为技术性标记」

Phase 5:(可选)给接收方的一页说明

解释「附录含技术性标记,用于完整性校验,非正文内容」。

不做的事

  • 不提供针对具体模型的对抗样本保证。
  • 不帮助绕过合法安全控制。