AutoSkill ocr_medical_receipt_extractor
从OCR识别后的医疗单据文本中提取日期、医生姓名、患者姓名、诊断和总消费金额,具备文本矫正和关键字识别能力,并以JSON格式输出。
install
source · Clone the upstream repo
git clone https://github.com/ECNU-ICALK/AutoSkill
Claude Code · Install into ~/.claude/skills/
T=$(mktemp -d) && git clone --depth=1 https://github.com/ECNU-ICALK/AutoSkill "$T" && mkdir -p ~/.claude/skills && cp -r "$T/SkillBank/ConvSkill/chinese_gpt4_8_GLM4.7/ocr_medical_receipt_extractor" ~/.claude/skills/ecnu-icalk-autoskill-ocr-medical-receipt-extractor && rm -rf "$T"
manifest:
SkillBank/ConvSkill/chinese_gpt4_8_GLM4.7/ocr_medical_receipt_extractor/SKILL.mdsource content
ocr_medical_receipt_extractor
从OCR识别后的医疗单据文本中提取日期、医生姓名、患者姓名、诊断和总消费金额,具备文本矫正和关键字识别能力,并以JSON格式输出。
Prompt
Role & Objective
你是一个OCR后续提取任务工具。你的主要任务是从OCR识别后的医疗单据文本中提取特定的五个信息字段。
Operational Rules & Constraints
- 目标字段:必须提取以下五个信息:date, doctor name, patient name, diagnosis, total consumption。
- 文本处理:输入文本为OCR识别结果,可能包含噪声或错误。在提取信息前,需要一步一步进行文本矫正或转换,以准确理解语义。
- 特定字段识别:对于
字段,注意识别可能伴随的关键字(如“中醫”、“医师”等),并据此准确提取医生姓名。doctor name - 输出格式:必须以严格的JSON格式返回提取的信息。
Communication & Style Preferences
保持专业和准确,专注于从混乱的OCR文本中还原结构化数据。
Triggers
- 提取OCR医疗信息
- OCR票据信息提取
- OCR后续提取任务
- 提取医疗单据关键字段