أطلقت NVIDIA نموذج Nemotron-Labs-TwoTower — نموذج لغة الانتشار ذو الأوزان المفتوحة
أطلقت NVIDIA نموذج Nemotron-Labs-TwoTower — نموذج لغة انتشار ذو أوزان مفتوحة يستند إلى العمود الفقري AR المجمّد Nemotron-3-Nano-30B-A3B. يعالج الابتكار قيود…
معالج بواسطة الذكاء الاصطناعي من MarkTechPost؛ بتحرير Hamidun News
نشرت NVIDIA نموذج Nemotron-Labs-TwoTower في 1 يوليو 2026 — وهو نموذج لغة قائم على الانتشار بأوزان مفتوحة، مبني فوق العمود الفقري الانحداري التلقائي المجمد Nemotron-3-Nano-30B-A3B. الهدف الرئيسي من الإصدار هو القضاء على اختناق الإنتاجية النظامي لتوليد النصوص، والذي يحد من إنتاجية جميع أنظمة اللغة الانحدارية التلقائية. يتم توزيع النموذج بموجب رخصة NVIDIA Nemotron Open Model License.
ما الذي يحد من نماذج الانحدار التلقائي
العمائر الانحدارية التلقائية (AR) هي أساس GPT و Llama و Gemini وغالبية LLMs الأخرى. المبدأ بسيط: يتم التنبؤ بكل رمز تالي بناءً على جميع الرموز السابقة، والعملية صارمة بالتتابع. هذا أنيق على مستوى التدريب، لكنه يخلق مشكلة محددة في الاستدلال الصناعي.
لا يمكن حساب الرمز التالي حتى ينتهي الرمز السابق. إضافة معجلات GPU إلى المجموعة لا تزيل هذا القيد — فهو مدمج في العمارة على مستوى الرسم البياني الحسابي: فك التشفير متسلسل بالتعريف. عند توليد إجابات طويلة، ينتظر المستخدم وقتاً أطول بشكل متناسب، وتصل تكلفة الرمز الواحد عند التوسع إلى حد أدنى صعب. بالنسبة لمقدمي الخدمات الذين يعالجون مليارات الطلبات يومياً، هذا يمثل تكاليف تشغيلية مباشرة ومستمرة. لهذا السبب يعتبر تسريع الاستدلال أحد الاتجاهات البحثية الرئيسية في الصناعة إلى جانب تقليل حجم النموذج والكمية.
توفر نماذج اللغة الانتشار المنفصلة آلية بديلة: بدلاً من فك التشفير خطوة تلو الخطوة، تقوم بتحسين كتلة الإخراج بأكملها بشكل متكرر في عدة خطوات. يفتح هذا إمكانية التوليد المتوازي لعدة رموز في ممر واحد — وبالتالي ملف تعريف إنتاجية مختلف بشكل أساسي.
كيفية عمل معمارية TwoTower
يجمع البناء ثنائي البرج بين نهج AR والانتشار في نموذج واحد:
- العمود الفقري AR: Nemotron-3-Nano-30B-A3B مدرب مسبقاً (30 مليار معامل، مجمد)
- رأس الانتشار: مكون قابل للتدريب فوق العمود الفقري المجمد
- أوزان مفتوحة: رخصة NVIDIA Nemotron Open Model License
- تاريخ الإصدار: 1 يوليو 2026
تجميد العمود الفقري AR هو قرار معماري مدروس. بدلاً من تدريب نموذج انتشار من الصفر، تستخدم NVIDIA الأساس الانحداري التلقائي المدرب مسبقاً كمصدر ثابت لتمثيلات اللغة السياقية. يتم تدريب مكون الانتشار فقط، مما يقلل من التكاليف الحسابية للتجريب وينقص البيانات اللازمة للتكيف. يسهل اختيار Nemotron-3-Nano-30B-A3B كعمود فقري أيضاً إعادة الإنتاج: يمكن للفرق الأخرى تكرار التجربة باستخدام نقطة فحص معروضة على الجمهور.
لماذا الانتشار للنص مهمة غير بديهية
أصبحت نماذج الانتشار المعيار لتوليد الصور — يعمل Stable Diffusion و Midjourney و DALL-E 3 على هذا المبدأ. التكيف مع النص أصعب بشكل أساسي: البكسلات موجودة في فضاء رقمي مستمر، بينما الرموز منفصلة. الضوضاء الغاوسية القياسية غير قابلة للتطبيق على الأجسام المنفصلة، لذلك يتم تطوير عمليات انتشار منفصلة خاصة للنصوص.
يتطور هذا الاتجاه بنشاط لكنه يبقى صغيراً وفقاً لمعايير الصناعة. أظهرت الأعمال السابقة — MDLM و SEDD وغيرها — نتائج تنافسية على معايير اللغة، لكن الفجوة مع أفضل أنظمة AR من حيث الجودة استمرت. محاولة نهج البرجين لـ NVIDIA هي محاولة لحل هذا التوازن: خذ التمثيلات اللغوية القوية للنموذج الانحداري التلقائي المدرب بالفعل وأضف آلية انتشار لها دون فقدان المعرفة المتراكمة حول بناء الجملة والدلالات والتبعيات السياقية.
الأوزان المفتوحة ذات قيمة بشكل منفصل للمجتمع الأكاديمي: سيتمكن الباحثون من إعادة إنتاج المعمارية، وقياس مكاسب الإنتاجية الحقيقية في مهامهم الخاصة، واقتراح تحسينات فوق نقطة الفحص المنشورة.
ما يعنيه هذا
Nemotron-Labs-TwoTower هي خطوة عملية نحو تسريع استدلال LLM دون استبدال الأجهزة. NVIDIA، كمزود رئيسي لوحدات معالجة الرسومات لسوق الذكاء الاصطناعي، مهتمة بتوسيع إمكانية تطبيق نماذج اللغة، بما في ذلك من خلال تقليل تكاليف الاستدلال. إذا ثبت أن النهج الهجين AR+انتشار جدواه في سيناريوهات الحمل الحقيقية — سواء من حيث جودة التوليد أو تسريع الإنتاجية الحقيقي — فقد يؤثر على القرارات المعمارية في تطوير جيل لاحق من أنظمة اللغة.
هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟
AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.
أهم ما في عالم الذكاء الاصطناعي — مرة كل أسبوع
سبع قصص مهمة فعلاً هذا الأسبوع، مختارة بعناية. بلا ضجيج ولا بيانات صحفية.
تم! تحقق من بريدك للتأكيد.