OpenMythos: بناء محولات متقدمة مع MLA و GQA في Colab

Q: ما هو المصدر؟

نُشر أصلاً على MarkTechPost. يعالج Hamidun News المواد ويكيّفها بالذكاء الاصطناعي.

Q: متى نُشر؟

25 مايو 2026. وقت القراءة: 3 دقيقة.

يوضح درس OpenMythos كيفية إنشاء محولات تكرارية في Google Colab باستخدام معماريات MLA و GQA و Sparse MoE و loop-scaled reasoning. يتضمن مقارنة معاملات النموذج…

هيئة تحرير Hamidun News

رصد الذكاء الاصطناعي · MarkTechPost

25 مايو 2026· 2 د

معالج بواسطة الذكاء الاصطناعي من MarkTechPost؛ بتحرير Hamidun News

OpenMythos: بناء محولات متقدمة مع MLA و GQA في Colab — المصدر: MarkTechPost. كولاج: Hamidun News.

◐ استمع للمقال

OpenMythos هو إطار عمل حديث يتيح للباحثين والمهندسين بناء معماريات معقدة للمحولات دون الحاجة إلى معدات متخصصة مكلفة. يوضح الدرس الجديد كيفية إنشاء سير عمل شامل من البداية إلى النهاية للمحولات التكرارية مع حقن عميق للمعاملات مباشرة في Google Colab - وهي بيئة متصفح متاحة للجميع مع GPU مجاني.

معماريات الانتباه: MLA و GQA

يناقش الدرس معماريتين أساسيتين لآلية الانتباه التي تجد تطبيقات متزايدة في النماذج الكبيرة الحديثة. MLA (Multi-head Latent Attention) هو نهج يضغط الاستعلامات في فضاء كامن بأبعاد أقل، مما يقلل التعقيد الحسابي من O(n²) إلى أرقام أكثر قابلية للإدارة. هذا مفيد بشكل خاص للتسلسلات الطويلة من الرموز، حيث يتطلب الانتباه القياسي ذاكرة وقت حساب تربيعي. يترجم MLA المهمة من فضاء عالي الأبعاد إلى تمثيل مضغوط، مما يسمح بمعالجة السياقات بطول 100+ ألف رمز.

GQA (Grouped Query Attention) يعمل بطريقة مختلفة تماماً: فهو يجمع المفاتيح والقيم عبر رؤوس الانتباه المتعددة لتسريع الاستدلال دون فقدان جودة الإنشاء بشكل كبير. بدلاً من مصفوفات K و V منفصلة لكل رأس، تتشارك عدة رؤوس زوج واحد. تُظهر مقارنة المعاملات بين MLA و GQA اختلافات مثيرة للاهتمام في قابلية التوسع. قد يكون MLA أرخص من حيث كفاءة الحوسبة للاستدلال، لكنه يتطلب تحضيراً خاصاً وضغط البيانات. GQA أكثر عموميةً، وغالباً ما تتقارب بشكل أسرع عند التدريب على مجموعات البيانات القياسية وتتطلب هندسة خاصة أقل.

Sparse MoE والتوسع التكراري

يغطي الدرس أيضاً Sparse Mixture of Experts (Sparse MoE) - وهي واحدة من أكثر الآليات الواعدة لتوسيع المعاملات دون زيادة الحوسبة. إنها آلية تختص فيها أجزاء متخصصة مختلفة من النموذج بأنواع مختلفة من البيانات أو المناطق المفاهيمية. عندما تعالج النموذج رمزاً، تختار شبكة الموجه أي عدد قليل من الخبراء سيعالجون هذا الرمز. هذا يسمح بتوسيع العدد الإجمالي للمعاملات دون نمو متناسب في الحوسبة: إذا كان لديك 100 خبير في النموذج، يتم تفعيل 8-16 فقط لكل مثال، مما يجعل التدريب أكثر كفاءة من الطبقات الكثيفة.

يضيف Loop-Scaled Reasoning التكرار إلى عمق النموذج، مما يسمح للشبكة بتحسين نفسها من خلال عدة تكرارات:

يمكن للنموذج إعادة حساب وتحسين التمثيلات على عدة مستويات من العمق
تحسّن كل تكرار نتيجة السابقة، وكأنها تفكر مرتين أو ثلاث مرات
يتم التحقق من استقرار هذه العملية من خلال النصف القطري الطيفي لمصفوفة الحقن
هذا يقلل من خطر انفجار التدرج عند نشر الأخطاء من خلال الشبكات العميقة جداً بـ 200+ طبقة

قابلية التكرار في المتصفح

توفر Google Colab وصولاً مجانياً إلى GPU، غالباً مع حجم ذاكرة كافٍ لتجارب متوسطة الحجم. باستخدام مثل هذه المعدات، يمكنك تدريب نماذج متوسطة الحجم واختبار فرضيات معمارية جديدة دون الاستثمار في موارد سحابية أو مراكز بيانات خاصة بك. تم تحسين الدرس خصيصاً للعمل في مثل هذه الظروف المقيدة: يستخدم الكود التحقق من التدرج وتقنيات توفير الذاكرة الأخرى، والبيانات اصطناعية للنماذج الأولية السريعة، لكن النتائج قابلة للتكرار بالكامل وسهلة النقل إلى عمليات نشر أكبر مع مجموعات TPU أو GPU.

النصف القطري الطيفي هو مقياس رياضي أساسي لاستقرار الأنظمة التكرارية والشبكات العميقة. إذا كان النصف القطري الطيفي لمصفوفة الحقن أقل من 1، تكون النظام مستقراً بضمان ولن يضخّم الأخطاء بشكل أسي عند نشر التدرجات من خلال طبقات عديدة. يساعد التحقق من هذا المعامل في الدفتر على التأكد من سلامة المعمارية قبل التوسع إلى بيانات الإنتاج والنماذج الكبيرة.

ماذا يعني هذا

يُديمقراطية OpenMythos الوصول إلى أدوات ومعماريات من مستوى البحث. لم تعد بحاجة إلى الوصول إلى أجهزة TPU مكلفة في السحابة أو مراكز بيانات خاصة للتجريب باستخدام معماريات محول متقدمة. هذا يسرع تكرار البحث في الأوساط الأكاديمية والشركات الناشئة والشركات الصغيرة، مما يقلل من حاجز الدخول للأفكار الجديدة في مجال الانتباه الفعال وأنظمة Mixture of Experts.

Hamidun News

أخبار الذكاء الاصطناعي بدون ضوضاء. اختيار تحريري يومي من أكثر من 400 مصدر. منتج من جمال حميدون، رئيس الذكاء الاصطناعي في Alpina Digital.

قناة Telegram RSS hamidun.com

هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟

AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.

🎓 Academy — 7 أيام مجاناً استشارة مجانية