أطلقت Mistral نموذج Small 4 — نموذج MoE يضم 119 مليار معلمة لـ reasoning والبرمجة وتعدد الوسائط
قدّمت Mistral نموذج Small 4، وهو نموذج MoE open-source جديد يضم 119 مليار معلمة ويجمع بين الدردشة العادية وreasoning وagentic coding وتعدد الوسائط. ويأتي…
معالج بواسطة الذكاء الاصطناعي من MarkTechPost؛ بتحرير Hamidun News
قدّمت شركة Mistral AI نموذج Mistral Small 4 — نموذج جديد مفتوح المصدر يجب أن يحل محل عدة خطوط منتجات منفصلة برقطة واحدة عالمية. بدلاً من نموذج تعليمات منفصل، ونموذج استدلال منفصل، ونموذج رؤية، ووكيل ترميز، يحصل المطورون على نقطة تفتيش MoE مع عمق استدلال قابل للتحويل.
واحد بدلاً من أربعة
الفكرة الرئيسية للإصدار ليست أن Mistral زادت ببساطة عدد المعاملات. يوحد Small 4 في منتج واحد الأدوار التي كانت موزعة سابقاً بين Mistral Small للتعليمات العادية، و Magistral للاستدلال المعقد، و Pixtral لفهم المعلومات المتعددة الطرق، و Devstral للبرمجة الموجهة للوكلاء. بالنسبة للفرق التي تبني منتجات فوق نماذج اللغات الكبيرة، هذا يهم أكثر من مجرد رقم قياسي آخر: توجيه أقل بين النماذج، بنية تحتية أبسط، فرص أقل للحصول على أنماط إجابات مختلفة على خطوات متجاورة من سيناريو واحد.
"لا يحتاج المستخدمون بعد الآن للاختيار بين وضع التعليمات السريع والاستدلال ومساعد متعدد الطرق," تقول إعلانات
Mistral.
من حيث الموضع، يستهدف Small 4 عدة أنواع من المهام في نفس الوقت: الدردشة العادية، العمل مع الأكواد، سير العمل الموجه للوكلاء، وتحليل الوثائق أو الصور المعقدة. تضع Mistral النموذج بشكل مباشر كطبقة عالمية للمهام الموجهة للشركات، حيث تحتاج سطح واجهة برمجية واحدة إلى الجمع بين طلبات النصوص والصور. هذا ملحوظ بشكل خاص في سوق حيث تحتفظ العديد من الفرق بنماذج منفصلة للدردشة، ونماذج منفصلة للاستدلال، ونماذج منفصلة لمهام الرؤية.
كيفية هيكل النموذج
من الناحية المعمارية، إنه نموذج Mixture-of-Experts يتضمن 119 مليار معامل. بالداخل — 128 خبيراً، يتم تفعيل أربعة منهم فقط لكل رمز، لذا تراهن Mistral ليس على الكثافة القصوى، بل على الكفاءة أثناء التشغيل. تؤكد الشركة أيضاً على نافذة سياق بحجم 256k والدعم الأصلي للنصوص والصور.
يتم إصدار النموذج بموجب رخصة Apache 2.0 مفتوحة المصدر، مما يعني أن النموذج لا يمكن استخدامه فقط عبر واجهة برمجية، بل يمكن نشره وتدريبه بشكل إضافي لسيناريوهاتك الخاصة.
- 119 مليار معامل في الهندسة المعمارية الإجمالية
- 128 خبيراً و 4 خبراء نشطين لكل رمز
- نافذة السياق 256k
- المدخلات: النصوص والصور
- رخصة Apache 2.0 والتوفر لاستضافة ذاتية
تؤكد Mistral بشكل خاص على معامل reasoning_effort. في الأساس، إنه مفتاح بين إجابة سريعة وطريقة أثقل للاستدلال خطوة بخطوة. في وضع none، يجب أن يتصرف النموذج بشكل أقرب إلى Mistral Small 3.2 وتقديم إجابات أخف مع كمون منخفض. في وضع high — العمل بشكل أقرب إلى سلسلة Magistral، حيث تهم جودة الاستدلال على المهام المعقدة أكثر من السرعة. المعنى العملي بسيط: بدلاً من مجموعة من نموذجين أو ثلاثة نماذج، يمكنك الاحتفاظ برشة واحدة وتغيير السلوك على مستوى الطلب.
السرعة والتشغيل
في الإعلان الرسمي، تراهن Mistral ليس فقط على الشمولية، بل أيضاً على اقتصاديات الاستدلال. تؤكد الشركة على تقليل وقت الإنشاء الكامل بنسبة 40% في تكوين محسَّن للكمون، وزيادة ثلاثية في عدد الطلبات في الثانية في سيناريو محسَّن للإنتاجية، مقارنة بـ Mistral Small 3. بشكل منفصل، تؤكد Mistral على أن Small 4 مع تفعيل الاستدلال يظهر نتائج مماثلة أو أفضل من GPT-OSS 120B على AA LCR و LiveCodeBench و AIME 2025، مع إنشاء إجابات أقصر. يتم نشر هذه المقارنات من قبل الشركة نفسها، لكن التركيز على "الجودة لكل رمز" للإنتاج مهم فعلاً.
للتشغيل، تدرج Mistral على الفور الخيارات العملية. يتوفر النموذج عبر واجهة برمجية Mistral و AI Studio، ومرفوع على Hugging Face، وتم الإعلان عنه لمجموعات vLLM و llama.cpp و SGLang و Transformers. لاستضافة ذاتية، المتطلبات لم تعد "سطح المكتب": يتم إدراج التكوين الأدنى كـ 4x NVIDIA HGX H100 أو 2x HGX H200 أو 1x DGX B200، مع التوصية بتكوينات أكثر قوة لأداء أفضل. لذا يبدو Small 4 وكأنه نموذج مفتوح ليس لجهاز محمول، بل لبنية تحتية خادم جادة وفرق منتج يهمهم التحكم والتخصيص والتكلفة المتوقعة للملكية.
ماذا يعني هذا
تدفع Mistral قطاع المصدر المفتوح نحو نماذج أكثر عمومية، حيث لا تكون الميزة الرئيسية الجودة فقط، بل أيضاً تبسيط النظام بأكمله حول نماذج اللغات الكبيرة. إذا أكد Small 4 الكفاءة المعلنة عنها في أعباء العمل الإنتاجية الحقيقية، ستحصل الشركة على حجة قوية ضد حديقة من نماذج الاستدلال والرؤية والترميز المنفصلة. بالنسبة للشركات، إنها فرصة لتقليل تعقيد طبقة الترتيب، وللمطورين — الحصول على طبقة أساس واحدة قابلة للتخصيص لمجموعة واسعة من المهام.
هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟
AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.