Optimization ref-image-ocr
이미지에서 텍스트를 추출(OCR)하여 마크다운으로 저장한다. 스크린샷, 다이어그램, 문서 이미지를 텍스트화한다.
install
source · Clone the upstream repo
git clone https://github.com/sunLeee/optimization
Claude Code · Install into ~/.claude/skills/
T=$(mktemp -d) && git clone --depth=1 https://github.com/sunLeee/optimization "$T" && mkdir -p ~/.claude/skills && cp -r "$T/.claude/skills/data-fetch/ref-image-ocr" ~/.claude/skills/sunleee-optimization-ref-image-ocr && rm -rf "$T"
manifest:
.claude/skills/data-fetch/ref-image-ocr/SKILL.mdsource content
ref-image-ocr
이미지에서 텍스트를 추출(OCR)하는 스킬.
목적
- 이미지에서 텍스트 추출
- 스크린샷, 다이어그램 텍스트화
- 문서 이미지 레퍼런스화
사용법
/ref-image-ocr docs/images/architecture-diagram.png /ref-image-ocr ~/Screenshots/error-message.png
프로세스
/ref-image-ocr [image-path] | v [Step 1] 이미지 확인 |-- 파일 존재 확인 |-- 이미지 형식 확인 (PNG, JPG, etc.) | v [Step 2] OCR 실행 |-- Claude Vision API 활용 |-- 또는 tesseract-ocr 사용 | v [Step 3] 텍스트 정리 |-- 구조화 (테이블, 리스트 감지) |-- 오타 교정 (필요 시) | v [Step 4] 마크다운 변환 |-- 적절한 형식 적용 | v [Step 5] 파일 저장 |-- docs/references/ocr/{filename}.md | v 완료
출력 템플릿
# {이미지 파일명} - OCR 결과 > **원본**: {image-path} > > **추출일**: {YYYY-MM-DD} > > **이미지 크기**: {width}x{height} --- ## 추출된 텍스트 {OCR로 추출된 텍스트 - 구조 보존} --- ## 메타데이터 - 원본 이미지: {path} - OCR 방식: Claude Vision / tesseract
예제
User: /ref-image-ocr docs/images/api-flow-diagram.png Claude: === 이미지 OCR 시작 === 파일: docs/images/api-flow-diagram.png [1/3] 이미지 분석 중... - 크기: 1200x800 - 형식: PNG - 내용: 플로우 다이어그램 [2/3] 텍스트 추출 중... - Claude Vision 사용 - 텍스트 박스: 15개 감지 [3/3] 구조화 중... - 플로우 단계: 5개 - 연결 관계 감지 === 완료 === 파일: docs/references/ocr/api-flow-diagram.md ### 추출된 플로우 1. Client → API Gateway 2. API Gateway → Auth Service 3. Auth Service → Database 4. Database → Auth Service (Response) 5. API Gateway → Client (Token)
관련 스킬
| 스킬명 | 관계 | 설명 |
|---|---|---|
| [@skills/ref-pdf-converter/SKILL.md] | 관련 | 스캔 PDF OCR에도 활용 |
| [@skills/diagram-generator/SKILL.md] | 역방향 | OCR 결과로 다이어그램 재생성 |
Changelog
| 날짜 | 변경 내용 |
|---|---|
| 2026-01-21 | 초기 스킬 생성 |