MarkTechPost→ المصدر

كشفت NVIDIA عن Nemotron-Labs-Diffusion: نموذج بفك ترميز ثلاثي

قدمت NVIDIA نموذج Nemotron-Labs-Diffusion، وهو نموذج لغة يدعم ثلاثة أوضاع لفك الترميز: ذاتي الانحدار، والانتشاري، والتخميني. والنتيجة الأساسية هي تسريع معالجة ا

كشفت NVIDIA عن Nemotron-Labs-Diffusion: نموذج بفك ترميز ثلاثي
المصدر: MarkTechPost. كولاج: Hamidun News.
◐ استمع للمقال

قدمت NVIDIA نموذج Nemotron-Labs-Diffusion — عائلة جديدة من نماذج معالجة اللغة الطبيعية التي تجمع بين ثلاث طرق لتوليد النصوص في معمارية واحدة. يعالج هذا الحل الهندسي الاختناق الرئيسي في نماذج اللغة الكبيرة الحديثة: النماذج القياسية تولد النصوص بشكل متسلسل، رمز واحد تلو الآخر، مما يحد من سرعة المعالجة وإنتاجية الخادم.

ثلاث أوضاع في معمارية واحدة يدعم

Nemotron-Labs-Diffusion ثلاث أوضاع فك تشفير في نفس الوقت. الأولى انحدارية تلقائية (AR)، الطريقة الكلاسيكية مثل ChatGPT: يراقب النموذج كل ما أنتجه حتى الآن ويولد الرمز التالي. الثانية انتشار متوازي، عندما يولد النموذج عدة رموز في آن واحد، كأنه "يرسم" النص من الطرفين.

الثالثة تنبؤية، حيث يتنبأ النموذج بسرعة بمجموعة من الرموز، ثم يتحقق من التنبؤات في ممر واحد. يسمح هذا النهج الهجين باختيار وضع يعتمد على المهمة: الدردشة الحية — استخدم التنبؤي (سريع)، معالجة دفعات المستندات — استخدم الانتشار المتوازي (متوازي)، التدقيق أو التحقق — استخدم الانحداري التلقائي (دقيق). الانحداري التلقائي: توليد متسلسل كلاسيكي، قابل للتنبؤ الانتشار المتوازي: توليد متوازي لعدة رموز في آن واحد * التنبؤ الذاتي: تنبؤ سريع وفعال مع التحقق بممر واحد ## أسرع ستة مرات على الرموز تتحدث النتائج بوضوح.

بنفس حجم النموذج (8 مليارات معامل) يعالج Nemotron-Labs-Diffusion رموزاً أكثر بستة أضعاف في ممر أمامي واحد عن Qwen3-8B. هذا فرق ضخم جداً. بالنسبة للتطبيقات التجارية، يعني هذا إما أن تكون الخدمة للمستخدمين أرخص، أو استضافة عدد أكبر من المستخدمين على خادم واحد.

المهم: هذا ليس عن سرعة الاستجابة لرسالة واحدة، بل عن الإنتاجية الإجمالية. يمكن للخادم معالجة 6 تسلسلات بالتوازي، بدلاً من واحد.

ثلاث أحجام، ثلاث صيغ أطلقت NVIDIA نموذج

Nemotron-Labs-Diffusion بثلاثة أحجام: 3B (للأجهزة الطرفية والأجهزة المحمولة)، 8B (خيار متوازن) و14B (للحد الأقصى من الجودة والتعقيد). كل حجم متاح بصيغ ثلاث: الأساسية (النموذج الأساسي)، التعليمية (محسّن للدردشات الآلية والتعليمات) والرؤية-اللغة (يعمل مع الصور والنصوص). هذا يعني أن الشركة تستطيع أخذ نموذج 8B مع دعم الرؤية، والحصول فوراً على ثلاث أوضاع توليد بالإضافة إلى التعامل مع الوسائط المتعددة.

ماذا يعني هذا النمط واضح: العالم ينتقل من الانحدار التلقائي البحت إلى

المعماريات الهجينة. النماذج التي تستطيع توليد عدد كبير من الرموز بالتوازي، والتنبؤ الاستكشافي والتحقق من صحتها ذاتياً لا تحتاج الاختيار بين السرعة والجودة — فهي تحسّن كلا المعاملين في نفس الوقت. قريباً، قد تبقى نماذج الانحدار التلقائي البحت فقط للمتخصصين الذين يحتاجون إلى استقرار مطلق في الإخراج.

ZK
Hamidun News
أخبار الذكاء الاصطناعي بدون ضوضاء. اختيار تحريري يومي من أكثر من 400 مصدر. منتج من جمال حميدون، رئيس الذكاء الاصطناعي في Alpina Digital.
ما رأيك؟
جارٍ تحميل التعليقات…