Mkhlab arabic-ocr

Arabic OCR text extraction from images and documents

install

source · Clone the upstream repo

git clone https://github.com/Moshe-ship/mkhlab

Claude Code · Install into ~/.claude/skills/

T=$(mktemp -d) && git clone --depth=1 https://github.com/Moshe-ship/mkhlab "$T" && mkdir -p ~/.claude/skills && cp -r "$T/hermes-skills/arabic-ocr" ~/.claude/skills/moshe-ship-mkhlab-arabic-ocr && rm -rf "$T"

manifest: hermes-skills/arabic-ocr/SKILL.md

source content

التعرف على النص العربي (OCR)

QARI-OCR (الأفضل للعربي)

عبر HuggingFace API

curl -s -X POST "https://api-inference.huggingface.co/models/qari-ai/QARI-OCR-v0.3" \
  -H "Authorization: Bearer $HF_TOKEN" \
  -H "Content-Type: image/png" \
  --data-binary @IMAGE_FILE

Tesseract (محلي — بديل مجاني)

تثبيت

# macOS
brew install tesseract tesseract-lang

# التأكد من دعم العربي
tesseract --list-langs | grep ara

استخراج النص

tesseract IMAGE_FILE output -l ara
cat output.txt

عربي + إنجليزي معا

tesseract IMAGE_FILE output -l ara+eng

تحسين الدقة

# تحسين الصورة أولا
magick IMAGE_FILE -resize 300% -sharpen 0x1 -threshold 50% improved.png
tesseract improved.png output -l ara --psm 6

متى تستخدم

المستخدم يرسل صورة فيها نص عربي
يريد استخراج نص من مستند PDF ممسوح
يريد قراءة مخطوطة أو وثيقة قديمة
يريد تحويل صورة واتساب فيها نص لنص قابل للنسخ

أوضاع PSM (Page Segmentation Modes)

الوضع	الاستخدام
`--psm 3`	تلقائي (افتراضي)
`--psm 6`	كتلة نص واحدة (الأفضل للمستندات)
`--psm 7`	سطر واحد
`--psm 8`	كلمة واحدة
`--psm 13`	نص خام بدون OSD

القواعد

الصور الواضحة عالية الدقة تعطي نتائج أفضل
المخطوطات والخطوط المزخرفة تكون أقل دقة — نبّه المستخدم
إذا النتيجة ضعيفة، اقترح تحسين الصورة أولا