Mkhlab whisper-arabic

Arabic speech-to-text transcription using OpenAI Whisper

install

source · Clone the upstream repo

git clone https://github.com/Moshe-ship/mkhlab

Claude Code · Install into ~/.claude/skills/

T=$(mktemp -d) && git clone --depth=1 https://github.com/Moshe-ship/mkhlab "$T" && mkdir -p ~/.claude/skills && cp -r "$T/hermes-skills/whisper-arabic" ~/.claude/skills/moshe-ship-mkhlab-whisper-arabic && rm -rf "$T"

manifest: hermes-skills/whisper-arabic/SKILL.md

source content

تحويل الصوت إلى نص عربي

Whisper (OpenAI — محلي)

تفريغ ملف صوتي

whisper AUDIO_FILE --language Arabic --model medium --output_format txt

النماذج المتاحة

النموذج	الحجم	الدقة	السرعة
`tiny`	39M	منخفضة	سريع جدا
`base`	74M	مقبولة	سريع
`small`	244M	جيدة	متوسط
`medium`	769M	عالية	بطيء
`large-v3`	1.5G	أعلى	بطيء جدا

الأفضل للعربي:

medium

(توازن بين الدقة والسرعة)

تفريغ مع timestamps

whisper AUDIO_FILE --language Arabic --model medium --output_format srt

تفريغ من فيديو

# استخرج الصوت أولا
ffmpeg -i VIDEO_FILE -vn -acodec pcm_s16le -ar 16000 -ac 1 audio.wav
# ثم فرّغ
whisper audio.wav --language Arabic --model medium

API (OpenAI Cloud)

curl -s -X POST "https://api.openai.com/v1/audio/transcriptions" \
  -H "Authorization: Bearer $OPENAI_API_KEY" \
  -F file=@AUDIO_FILE \
  -F model="whisper-1" \
  -F language="ar"

متى تستخدم

المستخدم يرسل ملف صوتي ويريد النص
يريد تفريغ محاضرة أو خطبة
يريد ترجمة صوتية (تفريغ + ترجمة)
يريد عمل subtitles لفيديو عربي

القواعد

نبّه أن اللهجات قد تقلل الدقة — الفصحى أدق
للملفات الطويلة (>30 دقيقة) اقترح تقسيم الملف أولا
إذا طلب تفريغ + ترجمة، استخدم whisper ثم skill translate