Skills fapiao-clipper
install
source · Clone the upstream repo
git clone https://github.com/openclaw/skills
Claude Code · Install into ~/.claude/skills/
T=$(mktemp -d) && git clone --depth=1 https://github.com/openclaw/skills "$T" && mkdir -p ~/.claude/skills && cp -r "$T/skills/alan5168/fapiao-clipper" ~/.claude/skills/clawdbot-skills-fapiao-clipper && rm -rf "$T"
manifest:
skills/alan5168/fapiao-clipper/SKILL.mdsource content
发票夹子 (Invoice Clipper) v1.3
纯 Python CLI 工具,OpenClaw / Claude Code / KimiClaw 等任何 Agent 平台均可使用。
v1.3 重大更新
简化架构为 2 级(2026-04-03):
- 第1级:PyMuPDF 文本提取(修复跨行匹配)
- 第2级:Qwen3-VL 视觉模型(备用)
- 去掉 GLM-OCR(不稳定)和 TurboQuant(未启用)
设计理念
发票 → 放文件夹 ↓ PDF 提取文字(两种引擎可选) ↓ 读不出才走第2级 视觉模型(扫描件才触发) ↓ 存入 SQLite 数据库 ↓ Agent 直接读数据库回答问题 ← 完全不消耗 API token
二级识别链 (v1.3)
| 级别 | 引擎 | 触发条件 | 特点 |
|---|---|---|---|
| 第1级 | PyMuPDF | 可搜索 PDF(默认) | 毫秒级,无需Java |
| 第2级 | Ollama Qwen3-VL | 图片/扫描件 | ~6.1GB 内存 |
大部分发票走第1级,零成本。
数据库(Agent 直接读)
发票处理后存在
~/Documents/发票夹子/invoices.db(SQLite)。
Agent 可以直接用自然语言读数据库,例如:
- "这个月收到哪些发票?"
- "有没有超过365天的发票?"
- "XX公司的发票有吗?"
不需要额外调用任何大模型 API,Agent 用自己的上下文就能直接读。
命令速查
| 用户意图 | 执行命令 |
|---|---|
| 扫描发票 | |
| 列出发票 | |
| 查询日期 | |
| 标记不报销 | |
| 恢复报销 | |
| 导出报销 | |
| 批量验真 | |
| 查看问题发票 | |
| 同步黑名单 | |
意图识别规则
| 用户说 | 执行的命令 |
|---|---|
| "扫描发票" / "整理邮箱" | |
| "本月发票" / "列出所有" | |
| "XX商家发票" | |
| "导出报销" | |
| "不要报销#3那张" | |
Agent 平台使用
零配置(推荐首次使用)
不想编辑 YAML?运行交互向导,回答几个问题即可:
python3 {baseDir}/setup_config.py
安装
git clone https://github.com/Alan5168/fapiao-clipper.git cd fapiao-clipper pip install -r requirements.txt cp config/config.yaml.template config/config.yaml
注意事项
- 原文件永不删除,
仅标记exclude - 发票有效期默认 365 天(可配置)
- 有 OpenClaw/Claude Code → 第1级搞定后,Agent 直接读数据库,不消耗 API