Mkhlab arabench
معيار جودة العربية — قيّم جودة أي نموذج ذكاء اصطناعي بالعربي عبر 8 فئات (ترجمة، قواعد، لهجات، تشكيل...). استخدم عندما يريد المستخدم مقارنة نماذج أو اختبار جودة العربي.
install
source · Clone the upstream repo
git clone https://github.com/Moshe-ship/mkhlab
Claude Code · Install into ~/.claude/skills/
T=$(mktemp -d) && git clone --depth=1 https://github.com/Moshe-ship/mkhlab "$T" && mkdir -p ~/.claude/skills && cp -r "$T/skills/arabench" ~/.claude/skills/moshe-ship-mkhlab-arabench-1cd9fd && rm -rf "$T"
manifest:
skills/arabench/SKILL.mdsource content
arabench — معيار جودة العربية للنماذج
أداة لتقييم جودة الذكاء الاصطناعي بالعربي عبر 8 فئات.
الأوامر
تشغيل المعيار الكامل
arabench run
اختبار سريع لمزوّد واحد
arabench quick PROVIDER_NAME
مقارنة مزوّدين
arabench compare PROVIDER_A PROVIDER_B
عرض لوحة النتائج
arabench leaderboard
شرح فئة تقييم
arabench explain CATEGORY
الفئات: translation, grammar, dialect, diacritization, summarization, qa, generation, culture
متى تستخدم
- المستخدم يسأل "أي نموذج أفضل بالعربي؟"
- يريد مقارنة بين Claude و GPT أو غيرهم
- يريد يعرف نقاط ضعف نموذج معين بالعربي