DGX Spark مع Qwen3: اختبار NVIDIA الذي لم يروِ القصة كاملة
يعد نظام NVIDIA DGX Spark (GB10) الجديد، المزود بذاكرة موحدة بسعة 128 غيغابايت، بحل مشكلات تشغيل النماذج اللغوية الكبيرة. لكن اختبارات الأداء التي استمرت…
معالج بواسطة الذكاء الاصطناعي من Habr AI؛ بتحرير Hamidun News
DGX Spark مع Qwen3: اختبار NVIDIA الذي لم يروِ الحكاية كاملة
في عالم الذكاء الاصطناعي، حيث نماذج اللغة الكبيرة (LLM) تصبح أكثر قوة وطلباً، فإن مشكلة نقص الذاكرة لتشغيلها حادة جداً. يواجه العديد من المتحمسين وحتى المحترفين حالات حيث نموذج يحتوي على عشرات مليارات المعاملات لا يتسع ببساطة في كمية محدودة من ذاكرة الفيديو (VRAM) لمعالجات الرسومات الحديثة. في هذه الحالات، يجب إجراء مقارنات: إما استخدام "التفريغ" لجزء من النموذج إلى المعالج المركزي (CPU)، الأمر الذي يقلل الأداء بشكل كارثي، أو اللجوء إلى حلول سحابية مكلفة، والتي قد تثير أيضاً مخاوف بشأن خصوصية البيانات.
NVIDIA، سعياً لحل هذه المشكلة العاجلة، قدمت نظام DGX Spark (المعروف أيضاً باسم GB10)، المزود بـ 128 غيغابايت من الذاكرة الموحدة. يتراوح السعر المعلن للجهاز بين 400 و500 ألف روبل. ومع ذلك، كما أظهرت اختبارات متعمقة لمدة أسبوعين، أثبتت نتائج عمل هذا النظام مع نموذج Qwen3 غموضاً، مما يثير تساؤلات حول القيمة الحقيقية لهذا الحل.
السياق الخاص بالمشكلة التي يُفترض بـ DGX Spark حلها معروف جيداً لأي شخص يعمل مع LLM. الحالة النموذجية هي محاولة تشغيل نموذج يحتوي على 32 مليار معامل على بطاقة رسومات من مستوى RTX 4090 بذاكرتها البالغة 24 غيغابايت. حتماً، يحدث عجز في الذاكرة.
البديل على شكل تفريغ إلى المعالج المركزي، رغم أنه يسمح بتشغيل النموذج، يؤدي إلى انخفاض غير مقبول في الأداء. الخدمات السحابية، بدورها، لا تتطلب فقط استثمارات مالية كبيرة، بل تثير أيضاً أسئلة حول أمان وخصوصية البيانات المعالجة، لأنها تُرسل إلى خوادم جهات خارجية. في هذا السياق، يبدو عرض NVIDIA على شكل DGX Spark بذاكرته الموحدة 128 غيغابايت واعداً.
الذاكرة الموحدة، على عكس الذاكرة المنفصلة التقليدية للمعالج المركزي ومعالج الرسومات، تسمح لكلا المعالجين بالعمل مع نفس كمية البيانات دون الحاجة إلى نسخها، وهذا نظرياً يجب أن يسرع المعالجة.
الاختبارات المتعمقة لـ DGX Spark مع نموذج Qwen3 كشفت عن عدد من التفاصيل الدقيقة. تم إجراء معايير موسعة، تشمل مقارنة صيغ تقليص النموذج المختلفة (طريقة تقلل حجم النموذج ومتطلبات الذاكرة على حساب فقدان بعض الدقة)، واختبارات مع أحجام مختلفة من السياق المدخل (كمية المعلومات التي يعالجها النموذج في وقت واحد) ومقارنة الأداء مع حلول معالجات الرسومات الأكثر تقليدية. أثبتت النتائج أنها بعيدة جداً عن الوضوح.
في بعض الحالات، أظهر DGX Spark بالفعل مزايا، خاصة عندما كان من الضروري التعامل مع كميات كبيرة من البيانات التي لم تتسع في ذاكرة الفيديو لبطاقات الرسومات المعيارية. ومع ذلك، في حالات أخرى، خاصة تحت الأحمال الكثيفة أو عند العمل مع أنواع معينة من النماذج، لم يظهر النظام المكاسب المتوقعة في الأداء. علاوة على ذلك، لوحظ أحياناً أن أداء DGX Spark كانت حتى أقل من الحلول المُحسَّنة جيداً القائمة على عدة معالجات رسومات قوية، أو تتطلب اللجوء إلى موارد سحابية مكلفة، مما يلغي الميزة الرئيسية للجهاز - المعالجة المحلية للبيانات.
تجدر الإشارة إلى أنه في بعض الاختبارات، عندما لم يتسع النموذج بالكامل في الذاكرة الموحدة، قام النظام تلقائياً بالتبديل إلى استخدام المعالج المركزي، مما أدى إلى تبطء كبير يضاهي التفريغ العادي.
تتطلب آثار هذه النتائج المتناقضة تحليلاً دقيقاً. تثير الكفاءة المالية لـ DGX Spark، بسعر نصف مليون روبل، علامات استفهام، خاصة عند الأخذ في الاعتبار أنه في عدد من الحالات لا يوفر تفوقاً ملموساً على حلول أكثر يسراً أو تقليدية. القيود المعمارية للنظام، التي تتجلى تحت أنواع معينة من الأحمال، تجعله ليس حلاً عالمياً، بل منتجاً متخصصاً. مواد التسويق من NVIDIA ربما تؤكد على مؤشرات الأداء الأقصى والحالات حيث 128 غيغابايت من الذاكرة هي فعلاً عامل حاسم، بينما تتجاهل الحالات التي قد تثبت هذه المعمارية فيها أنها غير فعالة أو حتى أسوأ. هذا يعني أن المشترين المحتملين يحتاجون إلى وزن مهامهم بعناية ومقارنتها بالقدرات الحقيقية لـ DGX Spark، بدلاً من الاعتماد فقط على الوعود الإعلانية.
في الختام، يمثل DGX Spark بذاكرته الموحدة 128 غيغابايت خطوة مثيرة للاهتمام، لكنها ليست مثالية، في تطور الأجهزة للعمل مع نماذج اللغة الكبيرة. يمكن أن يكون مفيداً لنطاق ضيق من المهام حيث تكون السعة الذاكرية حرجة والحلول الأخرى لا تستطيع ببساطة التعامل معها. ومع ذلك، بالنسبة لمعظم المستخدمين، فإن 128 غيغابايت من الذاكرة الموحدة ليست "رصاصة فضية" تحل جميع المشاكل. يجب أن نعترف بأنه لتحقيق أقصى أداء والجدوى الاقتصادية، غالباً ما تكون الحلول المُحسَّنة القائمة على عدة معالجات رسومات أو حتى المداخل الهجينة أكثر تفضيلاً. الاختبارات الدقيقة والفهم العميق للخصائص المعمارية لـ DGX Spark هما المفتاح لتحديد ما إذا كان هذا الجهاز يستحق بالفعل تكلفته الكبيرة لاحتياجاتك المحددة.
هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟
AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.