Mkhlab voice-assistant
مساعد صوتي عربي — حوّل الصوت لنص، عالجه، وردّ بصوت عربي. خط أنابيب كامل: Whisper → LLM → TTS. استخدم عندما يريد المستخدم تفاعل صوتي كامل.
install
source · Clone the upstream repo
git clone https://github.com/Moshe-ship/mkhlab
Claude Code · Install into ~/.claude/skills/
T=$(mktemp -d) && git clone --depth=1 https://github.com/Moshe-ship/mkhlab "$T" && mkdir -p ~/.claude/skills && cp -r "$T/skills/voice-assistant" ~/.claude/skills/moshe-ship-mkhlab-voice-assistant-3d7254 && rm -rf "$T"
manifest:
skills/voice-assistant/SKILL.mdsource content
مساعد صوتي عربي
خط أنابيب صوتي كامل: استقبال صوت → تفريغ → معالجة → رد صوتي.
خط الأنابيب
1. استقبال وتحويل الصوت
# تحويل أي صيغة لـ WAV مناسب لـ Whisper ffmpeg -i INPUT_FILE -ar 16000 -ac 1 -c:a pcm_s16le /tmp/mkhlab_input.wav
2. تفريغ النص (STT)
whisper /tmp/mkhlab_input.wav --language Arabic --model medium --output_format txt --output_dir /tmp/
3. معالجة النص
بعد التفريغ، مرر النص للنموذج اللغوي للرد.
4. تحويل الرد لصوت (TTS)
Voxtral (سحابي)
curl -s -X POST "https://api.mistral.ai/v1/audio/speech" \ -H "Authorization: Bearer $MISTRAL_API_KEY" \ -H "Content-Type: application/json" \ -d '{"model": "voxtral-mini-2025-12", "input": "النص", "voice": "aria", "language": "ar", "response_format": "mp3"}' \ --output /tmp/mkhlab_response.mp3
F5-TTS (محلي — Apple Silicon)
# إذا مثبت F5-TTS محلياً python3 -m f5_tts --text "النص العربي" --output /tmp/mkhlab_response.wav --lang ar
5. تشغيل الرد
# macOS afplay /tmp/mkhlab_response.mp3 # Linux aplay /tmp/mkhlab_response.wav
الأمر الكامل (سكربت واحد)
# تفريغ → طباعة النص → (المستخدم يعالج) → تحويل لصوت whisper "$1" --language Arabic --model medium --output_format txt --output_dir /tmp/ && \ cat /tmp/$(basename "$1" | sed 's/\.[^.]*$//').txt
متى تستخدم
- المستخدم يرسل ملف صوتي ويريد رد صوتي
- يريد "تكلمني بالعربي"
- يريد بودكاست أو محتوى صوتي من نص
- يطلب قراءة آية أو حديث بصوت