Дефицит памяти стал главным узким местом в AI-инфраструктуре — Huang
На конференции Dell World в Лас-Вегасе CEO Nvidia Jensen Huang заявил, что дефицит высокоскоростной памяти (HBM) — самое критичное узкое место в цепи поставок д

في مؤتمر Dell World في لاس فيغاس، أثار الرئيس التنفيذي لشركة Nvidia جينسن هوانج مشكلة حرجة تؤثر على صناعة الذكاء الاصطناعي بأكملها: نقص الذاكرة عالية السرعة. في محادثة مع الرئيس التنفيذي لشركة Dell مايكل ديل وصحفي بلومبرج إد لودلو، صرح هوانج مباشرة بأن نقص الذاكرة أصبح أكثر حدة من اختناقات تصنيع الرقائق نفسها. هذا اعتراف صريح بأن وتيرة نشر البنية التحتية للذكاء الاصطناعي تتباطأ ليس بسبب نقص وحدات معالجة الرسومات نفسها، بل بسبب عدم القدرة على إنتاج الكمية المطلوبة من الذاكرة.
لماذا أصبحت الذاكرة نادرة
ذاكرة HBM عالية السرعة (High Bandwidth Memory) هي نوع خاص من الذاكرة مدمج مباشرة في المسرع. تقوم بتخزين معاملات الشبكات العصبية والحسابات الوسيطة، مما يسمح لوحدة معالجة الرسومات بالعمل بسرعة كاملة دون كمون عند الوصول إلى ذاكرة النظام الأبطأ. يحتوي H100 و H200 من Nvidia على ما بين 80 و 141 جيجابايت من هذه الذاكرة.
المشكلة هي أن الطلب على HBM ينمو بشكل أسي، بينما الإنتاج لا يواكب حتى النمو الخطي. قبل عام، كانت الشركات الكبرى تطلب مئات وحدات معالجة الرسومات؛ الآن الحديث عن آلاف؛ قريباً ستكون هناك حاجة إلى ملايين. إنتاج الذاكرة هو دورة تكنولوجية متعددة السنوات: يتم بناء مصانع جديدة على مدى خمس إلى سبع سنوات، وتصبح التكنولوجيا معقدة بشكل متزايد، وهناك عدد قليل جداً من المنافسين في هذا القطاع.
من يتأثر بشكل أكبر
المنتجون الرئيسيون للذاكرة — Samsung و SK Hynix الكوريتان الجنوبيتان، بالإضافة إلى Micron الأمريكية — يكافحان لمواكبة نمو الطلب. تستثمر الشركات الثلاث عشرات المليارات في طاقات إنتاجية جديدة، لكن حتى ذلك لا يكفي: النقص ينمو بالفعل بشكل هندسي. هذا يخلق سلسلة من المشاكل في جميع أنحاء سلسلة التوريد:
- الأسعار آخذة في الارتفاع: تصبح وحدات معالجة الرسومات ذات الذاكرة الكافية أغلى بمقدار 1,5 إلى 2 مرة في السوق الثانوية
- عدم اليقين الاستراتيجي: لا تعرف الشركات ما إذا كانت ستتلقى المعدات المطلوبة في الوقت المناسب
- التنازلات المعمارية: مجبرة على استخدام نماذج أضيق، توزيع العمليات الحسابية على عدد أكبر من وحدات معالجة الرسومات
- التقسيم الطبقي للسوق: من يحصل أولاً على عقود توريد الذاكرة سيحقق ميزة تنافسية كبيرة
حتى Dell، أحد أكبر مدمجي الخوادم، تعتمد على إمدادات الذاكرة. لا تستطيع الشركة بيع المزيد من خوادم الذكاء الاصطناعي عالية الأداء إذا لم تكن هناك وحدات معالجة رسومات، وتبقى وحدات معالجة الرسومات ناقصة بدون قدرة ذاكرة كافية.
كيف تستجيب الصناعة
تعمل Nvidia بنشاط على أجيال جديدة من الذاكرة — HBM3e و HBM4 قيد التطوير بالفعل، مع عرض نطاق ترددي وأداء متوقع عالي. ومع ذلك، يتم قياس جدول الزمني لتطوير واعتماد والإنتاج الضخم لمعايير الذاكرة الجديدة بالسنوات وليس بالأشهر. بالتوازي، تبحث الشركة وشركاؤها عن حلول برمجية بديلة: تحسين البرمجيات، معماريات شبكات عصبية جديدة تتطلب ذاكرة أقل لكل وحدة أداء. لكن هذا أيضاً له حدود صارمة — لا يمكن تقليل جميع النماذج دون فقدان جودة الإخراج.
صرح هوانج: هذه ليست مشكلة قصيرة الأجل يمكن حلها في غضون أشهر. سيظل نقص
الذاكرة عاملاً مقيداً خطيراً لمدة عدة سنوات على الأقل.
ماذا يعني هذا لصناعة الذكاء الاصطناعي
يصبح نقص الذاكرة سقفاً جديداً لوتيرة نشر البنية التحتية للذكاء الاصطناعي. لن تتمكن جميع الشركات من نشر نماذج لغة كبيرة بالمقياس والإطار الزمني المطلوبين. هذا يخلق تقسيماً واضحاً للسوق: من يحصل على الوصول إلى الذاكرة أولاً سيتطور بشكل أسرع، بينما من يتأخر سيتخلف. بالنسبة للمستثمرين الجريئين والشركات الناشئة، هذا يعني أن الحصول على المعدات الصحيحة يصبح عاملاً لنجاح حرجاً مثل الفكرة والفريق نفسه. هذا يذكرنا بعصر نقص السيليكون، عندما كان مجرد امتلاك الرقائق يوفر ميزة تنافسية.