Mkhlab arabench

معيار جودة العربية — قيّم جودة أي نموذج ذكاء اصطناعي بالعربي عبر 8 فئات (ترجمة، قواعد، لهجات، تشكيل...). استخدم عندما يريد المستخدم مقارنة نماذج أو اختبار جودة العربي.

install
source · Clone the upstream repo
git clone https://github.com/Moshe-ship/mkhlab
Claude Code · Install into ~/.claude/skills/
T=$(mktemp -d) && git clone --depth=1 https://github.com/Moshe-ship/mkhlab "$T" && mkdir -p ~/.claude/skills && cp -r "$T/skills/arabench" ~/.claude/skills/moshe-ship-mkhlab-arabench-1cd9fd && rm -rf "$T"
manifest: skills/arabench/SKILL.md
source content

arabench — معيار جودة العربية للنماذج

أداة لتقييم جودة الذكاء الاصطناعي بالعربي عبر 8 فئات.

الأوامر

تشغيل المعيار الكامل

arabench run

اختبار سريع لمزوّد واحد

arabench quick PROVIDER_NAME

مقارنة مزوّدين

arabench compare PROVIDER_A PROVIDER_B

عرض لوحة النتائج

arabench leaderboard

شرح فئة تقييم

arabench explain CATEGORY

الفئات: translation, grammar, dialect, diacritization, summarization, qa, generation, culture

متى تستخدم

  • المستخدم يسأل "أي نموذج أفضل بالعربي؟"
  • يريد مقارنة بين Claude و GPT أو غيرهم
  • يريد يعرف نقاط ضعف نموذج معين بالعربي