MarkTechPost→ المصدر

OpenAI تكشف عن بروتوكول MRC لشبكات الحواسيب الفائقة التي تضم ملايين وحدات GPU

طورت OpenAI بالتعاون مع AMD وBroadcom وIntel وMicrosoft وNVIDIA بروتوكول MRC لشبكات الحواسيب الفائقة الخاصة بـ AI. يوزع الحزم عبر مئات المسارات في الوقت نفسه وي

معالج بواسطة الذكاء الاصطناعي من MarkTechPost؛ بتحرير Hamidun News
OpenAI تكشف عن بروتوكول MRC لشبكات الحواسيب الفائقة التي تضم ملايين وحدات GPU
المصدر: MarkTechPost. كولاج: Hamidun News.
◐ استمع للمقال

قدمت OpenAI، بالتعاون مع AMD و Broadcom و Intel و Microsoft و NVIDIA، بروتوكول MRC (Multipath Reliable Connection) — وهو بروتوكول شبكة جديد مفتوح المصدر لمجموعات AI الكبيرة. يحل البروتوكول مشكلة رئيسية: كيفية بناء حاسوب عملاق يضم مئات الآلاف من معالجات GPU عندما تصبح موثوقية الشبكة عنق الزجاجة.

كيفية عمل MRC

يوزع MRC حزم البيانات عبر مئات مسارات الشبكة في نفس الوقت. هذا يعني أنه إذا فشل أحد المسارات، تنتقل البيانات عبر طرق بديلة دون فقدان السرعة. يحدث التعافي من الأعطال في ميكروثوانٍ — بسرعة كبيرة بحيث لا يكاد التدريب العصبي يلاحظ الانقطاعات. تختار بروتوكولات الشبكة التقليدية مساراً أساسياً واحداً وتتحول إلى نسخة احتياطية فقط في حالة فشل المسار الأساسي. يعمل MRC وفقاً لمبدأ مختلف جذرياً: يراقب مئات المسارات المحتملة في الوقت الفعلي ويوزع الحمل ديناميكياً بين القنوات السليمة. هذا مثل الفرق بين طريق واحد به طريق التفافي وشبكة من الأزقة حيث يمكن للسيارات السير عبر أي طريق خالٍ.

المزايا العملية

الإنجاز الرئيسي لـ MRC هو تبسيط معمارية أجهزة الحاسوب العملاقة. في السابق، كانت المجموعات التي تضم 100 ألف+ معالج GPU تتطلب هرمية من ثلاث طبقات من مفاتيح Ethernet. مكلفة وصعبة التجميع وتتطلب طاقة كبيرة للتبريد. يسمح MRC بمستويين فقط، مما يبسط التصميم بشكل جذري ويقلل تكاليف المعدات.

  • معدات شبكة أقل — تجميع وصيانة مبسطة
  • زمن انتقال الشبكة المخفض بفضل المسارات الأكثر مباشرة بين معالجات GPU
  • تقليل استهلاك الطاقة لتبريد المفاتيح
  • قابلية أفضل للتوسع — تعمل المعمارية حتى مع ملايين معالجات GPU

معيار مفتوح للنظام البيئي

MRC ليس حلاً مغلقاً من شركة واحدة. اختارت OpenAI نهجاً مفتوحاً وشركت الشركات الرائدة في تصنيع معدات الشبكة: AMD و Broadcom و Intel و Microsoft و NVIDIA. هذا يعني أن الشركات الأخرى وموفري الخدمات السحابية ومراكز البحث ستتمكن من تنفيذ MRC في أجهزة الحاسوب العملاقة الخاصة بهم. أهمية انفتاح المعيار تكمن في أنه في هذه المقاييس الكبيرة، حتى التحسينات الصغيرة في موثوقية الشبكة والكفاءة تؤثر على تكلفة تدريب النماذج وسرعة التطور في صناعة AI بأكملها.

ما يعني هذا

MRC هو إجابة على تحدي الحجم. مع نمو نماذج AI، تزداد المتطلبات على البنية التحتية الحسابية. معمارية الشبكة التي تعمل لمجموعة من 10 آلاف معالج GPU قد تصبح عنق الزجاجة عند 500 ألف معالج GPU. يمكّن MRC من بناء أجهزة حاسوب عملاقة أكبر بدون إعادة نظر جذرية في المعمارية. بالنسبة للصناعة، هذا يعني تدريب نماذج أرخص ونشر أسرع للابتكارات.

ZK
Hamidun News
أخبار الذكاء الاصطناعي بدون ضوضاء. اختيار تحريري يومي من أكثر من 400 مصدر. منتج من جمال حميدون، رئيس الذكاء الاصطناعي في Alpina Digital.

هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟

AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.

ما رأيك؟
جارٍ تحميل التعليقات…