Yuan 3.0 Ultra: تريليون معلمة بكفاءة قياسية
أطلقت YuanLab AI نموذج Yuan 3.0 Ultra، وهو نموذج متعدد الوسائط مفتوح يعتمد على بنية Mixture-of-Experts ويضم تريليون معلمة. ومع ذلك، لا يُفعَّل في أي لحظة سوى…
معالج بواسطة الذكاء الاصطناعي من MarkTechPost؛ بتحرير Hamidun News
يدخل السباق نحو نماذج تريليونية المعاملات مرحلة جديدة — والآن أصبح معيار النجاح ليس الحجم بل القدرة على استخدامه بكفاءة. قدمت معملة يوان الصينية YuanLab AI نموذج Yuan 3.0 Ultra، وهو نموذج متعدد الأنماط مفتوح المصدر بناءً على معمارية Mixture-of-Experts التي تعمل بتريليون معامل، لكنها تفعّل فقط 68.8 مليار معامل في أي لحظة. خلف هذه الأرقام الجافة يكمن تحول أساسي في فلسفة بناء نماذج اللغة الكبيرة: بدلاً من زيادة القوة الحسابية "بشكل مباشر"، يراهن المطورون على الدقة الجراحية في استخدام الموارد.
لفهم نطاق هذا الادعاء، نحتاج إلى سياق. معمارية Mixture-of-Experts ليست بالجديدة. تستخدمها Google في Gemini، وتكمن في قلب Mixtral من Mistral AI، وبحسب بعض التسريبات — أيضاً في GPT-4 من OpenAI. جوهر هذا النهج هو أن النموذج يتكون من شبكات فرعية "متخصصة" متعددة، وللتعامل مع كل استفسار محدد، يتم تفعيل جزء صغير فقط منها. يسمح هذا بقدرة معرفة ضخمة دون الحاجة إلى تمرير كل رمز عبر جميع المعاملات. يأخذ Yuan 3.0 Ultra هذه الفكرة إلى حدها المنطقي: من تريليون معامل، يعمل في نفس الوقت أقل من سبعة بالمئة. للمقارنة، كان لدى Mixtral 8x7B نسبة أقل بكثير من حيث العدوانية من المعاملات النشطة إلى الإجمالية.
مقاييس الكفاءة المعلنة جديرة بالملاحظة بشكل خاص. وفقاً لـ YuanLab AI، تم تقليل إجمالي عدد معاملات النموذج بنسبة 33.3% مقارنة بالمعماريات ذات القدرات المكافئة، وحسّنت كفاءة التدريب المسبق بنسبة 49%. هذا يعني أن تحقيق جودة إجابة مماثلة يتطلب موارد حسابية ووقت تدريب أقل بكثير. في عصر تُقاس فيه تكلفة تدريب نموذج واحد رائد بعشرات ومئات الملايين من الدولارات، ويبقى الوصول إلى مجموعات GPU عنق زجاجة بالنسبة لمعظم الشركات، فإن مثل هذه الزيادة في الكفاءة ليست مجرد إنجاز تقني، بل حجة اقتصادية.
تعدد الأنماط في Yuan 3.0 Ultra هو جانب مهم آخر. يتم تحديد موضع النموذج على أنه قادر على العمل ليس فقط مع النصوص بل مع أنواع بيانات أخرى، مما يجعله مناسباً لمجموعة واسعة من المهام الشركاتية — من تحليل المستندات التي تحتوي على صور إلى سيناريوهات معقدة تتطلب فهم السياق من عدة أنماط. لا تزال تفاصيل القرارات المعمارية التي تمكّن تعدد الأنماط مكشوفة جزئياً فقط، لكن حقيقة دمج هذه القدرات في نموذج MoE بحجم تريليون تشير إلى نضج هذا النهج.
يستحق قرار جعل النموذج مفتوح المصدر انتباهاً منفصلاً. عملت معامل الذكاء الاصطناعي الصينية على مدى السنة والنصف الماضية على توسيع وجودها بشكل ثابت في المجتمع المفتوح: DeepSeek و Qwen من Alibaba و Yi من 01.AI — كلها تطلق نماذج بأوزان مفتوحة، مما يخلق بديلاً قوياً للأنظمة الغربية المغلقة.
يندرج Yuan 3.0 Ultra ضمن هذا الاتجاه لكنه يرفع المستوى: نموذج MoE تريليون المعاملات مع وصول مفتوح هو تحدٍ ليس فقط للمنافسين التجاريين بل لكل النظام البيئي للذكاء الاصطناعي المفتوح. السؤال هو ما إذا كان بإمكان الباحثين والشركات خارج أكبر مزودي الخدمات السحابية نشر واستخدام نموذج بهذا الحجم بشكل واقعي.
حتى مع الأخذ في الاعتبار أن المعاملات النشطة "فقط" 68.8 مليار، فإن الاستدلال على نموذج MoE تريليون المعاملات يتطلب بنية تحتية خطيرة للتخزين والتوجيه بين الخبراء.
بالنسبة للصناعة، يمثل Yuan 3.0 Ultra تأكيداً إضافياً على أن MoE تصبح المعمارية السائدة للنماذج من الجيل القادم. تحويلات كثيفة، حيث كل معامل نشط عند كل استدعاء، تبدو بشكل متزايد كنهج مسرف من عصر ماضٍ. في الوقت ذاته، يعمّق النموذج التنافس بين المعامل الصينية والأمريكية: إذا تم تأكيد مقاييس الكفاءة المعلنة من خلال معايير مستقلة، فسيكون هذا حجة جادة على أن الريادة التكنولوجية في الذكاء الاصطناعي لم تعد احتكاراً لوادي السيليكون.
مع ذلك، تستحق الادعاءات الجريئة شكاً مهنياً. حتى يتم نشر النتائج على معايير قياسية مقارنة بـ GPT-4o و Claude 3.5 و Gemini Ultra وغيرها من النماذج الرائدة، الحديث عن "كفاءة لا مثيل لها" مبكر جداً. سيبدأ الاختبار الحقيقي لـ Yuan 3.0 Ultra عندما يحصل المجتمع على إمكانية الوصول إلى الأوزان ويتمكن من إجراء تقييم مستقل. فقط عندئذ سيتضح ما إذا كان هذا النموذج اختراقاً حقيقياً أم حالة أخرى من الإطلاق الطموح لكن المبالغ فيه في سباق محموم نحو الحجم.
هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟
AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.