Mistral AI News→ المصدر

قدمت Mistral AI نموذج Mistral 3: سلسلة جديدة من النماذج مع Mistral Large 3

أطلقت Mistral AI سلسلة Mistral 3 - من النماذج المدمجة Ministral (3B و 8B و 14B) للاستخدام المحلي على أجهزة الكمبيوتر المحمولة والروبوتات وأجهزة IoT، إلى…

معالج بواسطة الذكاء الاصطناعي من Mistral AI News؛ بتحرير Hamidun News
قدمت Mistral AI نموذج Mistral 3: سلسلة جديدة من النماذج مع Mistral Large 3
المصدر: Mistral AI News. كولاج: Hamidun News.
◐ استمع للمقال

قدمت Mistral AI نموذج Mistral 3 - سلسلة جديدة من نماذج اللغة المفتوحة بأحجام مختلفة. تتضمن العائلة نماذج Ministral 3 المدمجة (3B و 8B و 14B) للاستخدام المحلي ونموذج Mistral Large 3 القوي (675B معامل) للمهام المعقدة. تم إطلاق جميع النماذج بموجب ترخيص Apache 2.0 وتدعم العمل مع النصوص والصور والطلبات متعددة اللغات.

Mistral Large 3: حدود جديدة

Mistral Large 3 - الرائد في السلسلة، والمدرب على 3000 معالج GPU من NVIDIA H200 من الصفر. إنه أول نموذج Mistral على معمارية خليط الخبراء المتفرقة (MoE) مع 41B معامل نشط من إجمالي 675B. في اختبارات LMArena، يحتل Mistral Large 3 المركز الثاني بين نماذج اللغة المفتوحة ويعرض نتائج قابلة للمقارنة مع أفضل النماذج المضبوطة بالتعليمات في السوق.

الفرق الرئيسي في معمارية MoE هو أن النموذج لا يستخدم جميع المعاملات في نفس الوقت. بدلاً من ذلك، يتم تنشيط أجزاء مختلفة من الشبكة لأنواع مختلفة من الطلبات - وهذا يجعل الاستدلال أسرع وأرخص من الاستخدام الكامل لـ 675B معامل. يسمح هذا النهج بتوسيع النماذج دون نمو متناسب في متطلبات الموارد الحسابية.

يعرض النموذج نتائج قوية بشكل خاص في المهام متعددة اللغات وفهم الصور. تعد الشركة بإطلاق نسخة قريباً مع قدرات موسعة للتفكير المنطقي والتحليل الأعمق للمشاكل المعقدة.

الشراكة مع NVIDIA للسرعة والقابلية للتوسع

عملت Mistral مع NVIDIA و vLLM و Red Hat لتحسين الاستدلال ونشر النماذج. تم تدريب جميع نماذج Mistral 3 على معالجات GPU NVIDIA Hopper، مما سمح باستخدام ذاكرة HBM3e عالية النطاق - مكون حرج للعمل مع شبكات عصبية ضخمة جداً. أنشأت NVIDIA تحسينات متخصصة في TensorRT-LLM و SGLang للتنفيذ الفعال للتعليمات.

بالنسبة لـ Mistral Large 3، تمت إضافة دعم نوى Blackwell الفعالة وتحسين معمارية الانتباه/MoE للسياقات الطويلة على أنظمة GB200 NVL72. هذا يسمح بخدمة أحمال العمل عالية الأداء بأقل تأخير.

يسهل نشر النماذج المدمجة Ministral على الآلات المحلية:

  • على DGX Spark للحلول الخاصة بالمؤسسات
  • على أجهزة كمبيوتر RTX والمحمولة للتطوير
  • على أجهزة Jetson لـ IoT والروبوتات
  • دعم النشر من البنية التحتية السحابية إلى أجهزة edge

تعني هذه التكاملية الرأسية أن المطورين يحصلون على مسار واحد لتشغيل نفس النماذج من مركز البيانات إلى أجهزة edge المحلية دون إعادة كتابة الكود.

Ministral 3: أداة قوية لـ edge

لحسابات edge والاستخدام المحلي، أطلقت Mistral نموذج Ministral 3 في ثلاثة أحجام: 3B و 8B و 14B معامل. كل حجم متاح في ثلاث متغيرات: النموذج الأساسي، وإصدار مضبوط بالتعليمات لتنفيذ التعليمات، وإصدار مع قدرات موسعة للتفكير المنطقي.

تدعم جميع المتغيرات العمل مع الصور والنصوص بأكثر من 30 لغة، بما في ذلك اللغات التركية والروسية. على الرغم من صغر الحجم، توفر Ministral 3 أفضل توازن في الصناعة بين الأداء والتكلفة بين النماذج المفتوحة. هذا حاسم للشركات التي تريد تشغيل الذكاء الاصطناعي محلياً دون خدمات سحابية.

ماذا يعني هذا لصناعة الذكاء الاصطناعي

تصبح نماذج اللغة المفتوحة أكثر عملية وإمكانية للوصول. مع ترخيص Apache 2.0، يمكن لأي شخص استخدام وتعديل وتطوير نماذج Mistral في المشاريع التجارية بدون قيود. بالنسبة للمطورين، هذا يعني مرونة أكثر في اختيار المكدس، وبالنسبة للمؤسسات - تقليل تكاليف البنية التحتية للذكاء الاصطناعي والاعتماد الأقل على موفري الخدمات السحابية.

قد تصبح Mistral 3 نقطة تحول في الحركة نحو أنظمة الذكاء الاصطناعي المستقلة والمدارة محلياً.

ZK
Hamidun News
أخبار الذكاء الاصطناعي بدون ضوضاء. اختيار تحريري يومي من أكثر من 400 مصدر. منتج من جمال حميدون، رئيس الذكاء الاصطناعي في Alpina Digital.

هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟

AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.

ما رأيك؟
جارٍ تحميل التعليقات…