TechCrunch→ المصدر

شركة XCENA الكورية الجنوبية جمعت 135 مليون دولار، تراهن على الذاكرة بدلاً من قوة الحوسبة

جمعت شركة XCENA الكورية الجنوبية 135 مليون دولار بتقييم بلغ 570 مليون دولار. تطعن الشركة في إجماع الصناعة: اختناق الذكاء الاصطناعي الحديث ليس قوة الحوسبة وسعة م

شركة XCENA الكورية الجنوبية جمعت 135 مليون دولار، تراهن على الذاكرة بدلاً من قوة الحوسبة
المصدر: TechCrunch. كولاج: Hamidun News.
◐ استمع للمقال

جمعت شركة XCENA الناشئة المتخصصة في الرقائق الإلكترونية من كوريا الجنوبية 135 مليون دولار من الاستثمارات بقيمة 570 مليون دولار. تراهن الشركة على أطروحة معاكسة للحدس: الاختناق في تطوير الذكاء الاصطناعي الحديث ليس قوة الحوسبة في وحدات معالجة الرسومات، بل سرعة الوصول إلى الذاكرة.

الجميع يرى المشكلة، لكن ليس الجميع يفهم سببها الحقيقي

كانت الصناعة مهووسة بنقص وحدات معالجة الرسومات خلال السنتين الماضيتين. يأتي كل يوم بأخبار نقص قوة الحوسبة وحروب الرقائق وقيود الشراء. تنظر XCENA إلى نفس المشكلة، لكنها ترى الأمر بشكل مختلف. وفقاً لمنطقهم، حتى لو أعطيت النموذج أقوى رقاقة في العالم، فسيقضي كميات ضخمة من الوقت في انتظار انتقال البيانات اللازمة من الذاكرة إلى النواة الحاسوبية. هذه الظاهرة، المعروفة باسم اختناق الذاكرة، تؤثر على الأداء بشكل أكثر حدة مما يدركه الكثيرون.

تؤكد بنية وحدة معالجة الرسومات الحديثة ذلك. النواة الحاسوبية قادرة على إجراء العمليات في أجزاء من البليون من الثانية. الوصول إلى الذاكرة؟ غالباً ما يكون هذا بلايين أجزاء من البليون من الثانية من الانتظار. يظهر الموقف المتناقض: المعالج مستعد للحساب، لكنه مضطر للانتظار حتى تصل البيانات.

تنمو المشكلة مع حجم النموذج وتعقيده

تتفاقم المشكلة بشكل أسي. عند تدريب نموذج بتريليونات المعاملات، يصبح حجم البيانات التي يجب نقلها بين الذاكرة والمعالج فلكياً ببساطة. لا تستطيع الذاكرة مواكبة تدفق الطلبات.

  • كل مضاعفة لمعاملات النموذج تزيد المتطلبات الذاكرية بشكل أسي
  • وقت الوصول إلى الذاكرة يزداد بشكل غير خطي مع زيادة الحجم
  • استهلاك الطاقة لنقل البيانات يتجاوز استهلاك الطاقة للعمليات الحسابية ذاتها
  • حتى وحدات معالجة الرسومات الحديثة تعمل بنسبة 30-50% من طاقتها بسبب انتظار الذاكرة

المهندسون في المختبرات الكبرى يرون هذه المشكلة بالفعل عملياً. عند تدريب نماذج بحجم GPT، يتم قضاء جزء كبير من وقت المعالج في انتظار البيانات اللازمة، بدلاً من العمليات الحسابية ذاتها.

على ما تراهن XCENA

تطور الشركة الناشئة بنى ذاكرة متخصصة تعد بتقليل زمن انتظار الوصول وزيادة نطاق الترددات. إذا نجحت هذه الطريقة، فقد توفر ميزة تنافسية ضخمة للمختبرات والشركات التي تدرب نماذج كبيرة. استثمار 135 مليون دولار من صناديق رأس مال مغامر جادة يعني أن الصناعة تبدأ في الإيمان بهذه الأطروحة. قد يشير هذا أيضاً إلى أن بعض الباحثين الرئيسيين ومطوري النماذج واجهوا هذه المشكلة مباشرة بالفعل ويبحثون بنشاط عن حلول.

ما يعنيه هذا لمستقبل الذكاء الاصطناعي

إذا كانت XCENA محقة، فإن بنية بنية الذكاء الاصطناعي للجيل القادم ستبدو مختلفة. بدلاً من مجرد سباق لوحدات معالجة رسومات أكثر قوة، سيكون هناك سباق موازٍ وبنفس القدر من الكثافة للحصول على سرعة وصول ذاكرة أسرع. يمكن لهذا أن يعيد تعريف بشكل كبير أي الشركات والمختبرات يمكنها تحمل تدريب الجيل القادم من النماذج. ربما تكون XCENA مخطئة في تحليلها، والاختناق الرئيسي حقاً هو الحوسبة. لكن حقيقة أن الشركة الناشئة تمكنت من جذب مثل هذه المبالغ على أساس هذه الرؤية تشير إلى شيء ما: يبدأ التشكك في التنازل عن مكانه لدراسة جادة للذاكرة كقيد حرج على تقدم الذكاء الاصطناعي.

ZK
Hamidun News
أخبار الذكاء الاصطناعي بدون ضوضاء. اختيار تحريري يومي من أكثر من 400 مصدر. منتج من جمال حميدون، رئيس الذكاء الاصطناعي في Alpina Digital.
ما رأيك؟
جارٍ تحميل التعليقات…