MarkTechPost→ المصدر

معمارية Decoupled DiLoCo من DeepMind تحل مشكلة توسع الذكاء الاصطناعي

يتطلب تدريب نماذج اللغة المتقدمة تشغيل منسق لعشرات الآلاف من وحدات معالجة الرسومات. حتى الآن، كان فشل أو تبطيء رقاقة واحدة يؤدي إلى توقف مجموعة الحوسبة…

معالج بواسطة الذكاء الاصطناعي من MarkTechPost؛ بتحرير Hamidun News
معمارية Decoupled DiLoCo من DeepMind تحل مشكلة توسع الذكاء الاصطناعي
المصدر: MarkTechPost. كولاج: Hamidun News.
◐ استمع للمقال

تدريب الشبكات العصبية الاصطناعية الحديثة ليس مسألة سحر رياضي بقدر ما هو تحدٍ تنسيقي هندسي بلا سابقة. داخل مراكز البيانات الضخمة، يجب على عشرات الآلاف من معالجات الرسوميات الحديثة أن تعمل في وئام مثالي، متبادلة البيانات باستمرار ومتزامنة كل تحديث تدرج عبر الشبكة. ومع ذلك، في هذه السيمفونية من السيليكون تكمن نقطة ضعف مميتة: إذا فشل حتى رقاقة واحدة أو ببساطة بدأت تعمل بشكل أبطأ بسبب الإفراط في التسخين، قد يتوقف كل عملية التدريب بشكل كامل. مع سعي الصناعة لإنشاء نماذج بمئات المليارات والتريليونات من المعاملات، يصبح هذا الهشاشة المعمارية ليس مجرد إزعاج تقني، بل حاجزاً اقتصادياً يستحيل تجاوزه.

لقد اعتمدت الصناعة لسنوات عديدة على التزامن الصارم. تتطلب خوارزميات التدريب الموزع التقليدية أن تكمل جميع العقد الحاسوبية مرحلة عملها، وتتبادل النتائج، وتحسبها في المتوسط، وفقط بعد ذلك تنتقل إلى الخطوة التالية. إنها تشبه قافلة سيارات تكون سرعتها محدودة بأبطأ سيارة. في نطاق الحواسيب العملاقة، يقترب احتمال الفشل الهندسي في أي دقيقة من التأكد المطلق، مما يجبر المهندسين على حفظ حالات النموذج الوسيطة باستمرار وإعادة تشغيل المجموعات. جزء ضخم من أغلى وقت حاسوبي في العالم يُنفق لا على تدريب الذكاء الاصطناعي، بل على انتظار العناصر المتأخرة والتعافي من الأخطاء.

هذه المشكلة الأساسية هي بالضبط ما تحله المعمارية الجديدة من الباحثين في Google DeepMind، والتي حملت اسم Decoupled DiLoCo. نجح المهندسون في كسر حلقة الرجعية المفرغة للتزامن الصارم بطريقة أنيقة لتدريب غير متزامن تماماً. يكمن مفهوم التكنولوجيا في فصل عمليات الحسابات المحلية على الرقاقات الفردية عن تحديثات الأوزان العامة للنموذج بالكامل. بدلاً من إجبار الشبكة بأكملها على انتظار المتأخرين، يسمح النظام للعقد الحاسوبية السليمة بمواصلة العمل، وتجميع المعارف ودمجها في الهيكل العام مع استعداد كل مجموعة فردية.

تبدو النتائج التقنية لهذا النهج الجديد وكأنها ثورة حقيقية لمعماريي أنظمة السحابة. وفقاً للبيانات المنشورة، يحقق Decoupled DiLoCo مستوى حمل حاسوبي مفيد، أو ما يسمى بمقياس goodput، في 88 بالمائة حتى في ظروف معدل فشل هندسي مرتفع بشكل غير طبيعي. في الأنظمة المتزامنة التقليدية، كانت ترددات الفشل المماثلة ستؤدي إلى انهيار كارثي للكفاءة، حيث كانت المجموعة ستقضي وقتاً أطول في إعادة التشغيل منها في التدريب الفعلي. تخفي الطبيعة غير المتزامنة للمعمارية الجديدة كلاً من كمون الشبكة والإيقاف المفاجئ للمعدات، مما يجعل عملية التدريب مرنة بشكل لا يصدق في مواجهة فوضى العالم الحقيقي.

إن آثار هذا الاختراق على الصناعة تتجاوز بكثير مجرد تحسين الاستقرار. أولاً وقبل كل شيء، يغير بشكل جذري اقتصاديات إنشاء الذكاء الاصطناعي المتقدم. إذا كانت الخوارزمية قادرة على التدريب بكفاءة على الأجهزة غير المستقرة، ستتمكن الشركات من استخدام ما يسمى بالنماذج السحابية القابلة للانقطاع—موارد حاسوبية أرخص بكثير يمكن لموفري السحابة إيقافها في أي لحظة. علاوة على ذلك، فإن تقليل متطلبات الاتصال المستمر والسريع جداً بين الرقاقات يفتح الأبواب للتدريب الموزع الحقيقي. بدلاً من بناء مركز بيانات عملاق واحد بهيكل أساسي شبكي مكلف بشكل لا يصدق، سيتمكن المطورون من دمج موارد خادم متناثرة تقع في أجزاء مختلفة من العالم.

من الواضح أننا نشهد تحولاً حاسماً في نموذج قابلية توسع الأنظمة الحاسوبية. مع تعقيد القوانين الفيزيائية والقيود الإنتاجية إنشاء رقاقات فردية أسرع، تتصدر هندسة البرمجيات الساحة—الهندسة القادرة على توحيد الأجهزة غير الكاملة في ذكاء يعمل بلا عيب. تثبت معمارية Google DeepMind أن المسار نحو الجيل التالي من الذكاء الاصطناعي لا يكمن في الموثوقية المثالية لكل معالج فردي، بل في إنشاء شبكات ذكية لا مركزية قادرة على الشفاء الذاتي والتكيف مع أي ظروف أثناء التنقل.

ZK
Hamidun News
أخبار الذكاء الاصطناعي بدون ضوضاء. اختيار تحريري يومي من أكثر من 400 مصدر. منتج من جمال حميدون، رئيس الذكاء الاصطناعي في Alpina Digital.

هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟

AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.

ما رأيك؟
جارٍ تحميل التعليقات…