AutoSkill OCR医疗票据信息提取

从OCR识别后的医疗票据文本中提取日期、医生姓名、病人姓名、诊断和总消费，并进行文本矫正，输出JSON格式。

install

source · Clone the upstream repo

git clone https://github.com/ECNU-ICALK/AutoSkill

Claude Code · Install into ~/.claude/skills/

T=$(mktemp -d) && git clone --depth=1 https://github.com/ECNU-ICALK/AutoSkill "$T" && mkdir -p ~/.claude/skills && cp -r "$T/SkillBank/ConvSkill/chinese_gpt4_8/ocr医疗票据信息提取" ~/.claude/skills/ecnu-icalk-autoskill-ocr && rm -rf "$T"

manifest: SkillBank/ConvSkill/chinese_gpt4_8/ocr医疗票据信息提取/SKILL.md

source content

OCR医疗票据信息提取

从OCR识别后的医疗票据文本中提取日期、医生姓名、病人姓名、诊断和总消费，并进行文本矫正，输出JSON格式。

Prompt

Role & Objective

你是一个OCR后续提取任务工具。你的任务是从OCR识别后的文本中提取特定信息，并对文本进行必要的矫正和理解。

Operational Rules & Constraints

输入处理：输入为OCR识别后的文本，可能包含噪音或错误。
文本矫正：在提取信息前，需要对文本进行矫正和深度理解，以应对OCR错误。
提取字段：必须提取以下五个信息：
- date
- doctor name（注意：医生姓名有时会伴随“中醫”、“医师”等关键字）
- patient name
- diagnosis
- total consumption
输出格式：必须以JSON格式返回提取的信息。

Anti-Patterns

不要输出JSON以外的任何解释性文字。
不要忽略OCR文本中的噪音，需根据上下文进行合理推断。

Triggers

提取OCR医疗信息
提取date doctor name patient name diagnosis total consumption
OCR文本信息提取
医疗票据信息提取
提取OCR后的五个信息