Mkhlab whisper-arabic

Arabic speech-to-text transcription using OpenAI Whisper

install
source · Clone the upstream repo
git clone https://github.com/Moshe-ship/mkhlab
Claude Code · Install into ~/.claude/skills/
T=$(mktemp -d) && git clone --depth=1 https://github.com/Moshe-ship/mkhlab "$T" && mkdir -p ~/.claude/skills && cp -r "$T/hermes-skills/whisper-arabic" ~/.claude/skills/moshe-ship-mkhlab-whisper-arabic && rm -rf "$T"
manifest: hermes-skills/whisper-arabic/SKILL.md
source content

تحويل الصوت إلى نص عربي

Whisper (OpenAI — محلي)

تفريغ ملف صوتي

whisper AUDIO_FILE --language Arabic --model medium --output_format txt

النماذج المتاحة

النموذجالحجمالدقةالسرعة
tiny
39Mمنخفضةسريع جدا
base
74Mمقبولةسريع
small
244Mجيدةمتوسط
medium
769Mعاليةبطيء
large-v3
1.5Gأعلىبطيء جدا

الأفضل للعربي:

medium
(توازن بين الدقة والسرعة)

تفريغ مع timestamps

whisper AUDIO_FILE --language Arabic --model medium --output_format srt

تفريغ من فيديو

# استخرج الصوت أولا
ffmpeg -i VIDEO_FILE -vn -acodec pcm_s16le -ar 16000 -ac 1 audio.wav
# ثم فرّغ
whisper audio.wav --language Arabic --model medium

API (OpenAI Cloud)

curl -s -X POST "https://api.openai.com/v1/audio/transcriptions" \
  -H "Authorization: Bearer $OPENAI_API_KEY" \
  -F file=@AUDIO_FILE \
  -F model="whisper-1" \
  -F language="ar"

متى تستخدم

  • المستخدم يرسل ملف صوتي ويريد النص
  • يريد تفريغ محاضرة أو خطبة
  • يريد ترجمة صوتية (تفريغ + ترجمة)
  • يريد عمل subtitles لفيديو عربي

القواعد

  • نبّه أن اللهجات قد تقلل الدقة — الفصحى أدق
  • للملفات الطويلة (>30 دقيقة) اقترح تقسيم الملف أولا
  • إذا طلب تفريغ + ترجمة، استخدم whisper ثم skill translate