أطلقت Nvidia نموذج Nemotron 3 Nano Omni — نموذج متعدد الأنماط مفتوح المصدر لوكلاء الحافة

قدمت Nvidia نموذج Nemotron 3 Nano Omni — وهو نموذج متعدد الأنماط مفتوح المصدر لوكلاء الحافة يجمع بين النص والصور والصوت والفيديو والمستندات في معمارية واحدة. يحتوي النموذج على 30 مليار معامل، لكن فقط 3 مليارات منها نشطة أثناء الاستدلال، مما يتيح تشغيله على معالج رسومات واحد. وتعتبر Nvidia هذا الإصدار خطوة من البنية التحتية نحو منتجات الذكاء الاصطناعي الخاصة بها.

Khamidun Zhemal

رصد الذكاء الاصطناعي · TNW

28 أبريل 2026· 3 د

معالج بواسطة الذكاء الاصطناعي من TNW؛ بتحرير Hamidun News

أطلقت Nvidia نموذج Nemotron 3 Nano Omni — نموذج متعدد الأنماط مفتوح المصدر لوكلاء الحافة — المصدر: TNW. كولاج: Hamidun News.

◐ استمع للمقال

أطلقت إن‌فيديا في 28 أبريل 2026 نموذج Nemotron 3 Nano Omni — وهو نموذج متعدد الوسائط مفتوح المصدر مصمم للعوامل الذكية المستقلة على أجهزة الحافة. هذا ليس مجرد إصدار آخر لنظام البيئة CUDA: تثبت الشركة أنها تريد كسب الأموال ليس فقط على الأجهزة بل أيضاً على النماذج نفسها.

ما الذي يستطيع النموذج فعله

يجمع Nemotron 3 Nano Omni فهم النصوص والصور والصوت والفيديو في بنية معمارية واحدة. يعمل النموذج أيضاً مع المستندات والرسوم البيانية والواجهات الرسومية، وينتج ردوداً نصية. في الواقع، تقدم إن‌فيديا ليس مجموعة من عدة نماذج منفصلة للرؤية والكلام والمستندات، بل محرك موحد واحد للمهام التي يحتاج فيها العامل إلى رؤية الشاشة وقراءة ملف والاستماع إلى أمر صوتي والاستجابة دون تأخيرات غير ضرورية بين الخدمات.

الفكرة الأساسية هي أن النموذج كبير من حيث الحجم الإجمالي لكنه خفيف نسبياً في العملية. يحتوي Nemotron 3 Nano Omni على 30 مليار معامل، لكن يتم تفعيل 3 مليارات فقط في كل خطوة استدلال بفضل بنية mixture-of-experts. تؤكد إن‌فيديا أن هذا النهج يوفر مكاسب تصل إلى تسع مرات في الإنتاجية مقارنة بنماذج متعددة الوسائط المفتوحة القابلة للمقارنة، والنموذج يتصدر في ستة معايير للعمل مع المستندات والفيديو والصوت.

تم تدريب المكون النصي الأساسي على 25 تريليون رمز ويدعم نافذة سياق تصل إلى 256 ألف رمز. داخلياً، يستخدم النموذج مخطط Mamba-Transformer هجين. وفقاً لوصف إن‌فيديا، فإنه يجمع بين 23 طبقة Mamba-2 و23 طبقة mixture-of-experts وست طبقات grouped-query attention.

يتم توجيه كل رمز إلى ستة فقط من 128 خبيراً بالإضافة إلى خبير مشترك، لذا لا تتضخم الحسابات. بالنسبة للفيديو، يتم تطبيق التفافات ثلاثية الأبعاد تأخذ في الاعتبار الحركة بين الإطارات، بدلاً من مجرد تحليل الفيديو كمجموعة من الصور الثابتة. هذا النهج الهندسي هو ما يجب أن يجعل النموذج مناسباً للعوامل في الوقت الفعلي على وحدة معالجة رسومات واحدة.

30 مليار معامل في المجموع، 3 مليارات نشطة في الاستدلال
النشر ممكن على وحدة معالجة رسومات واحدة، بدون مجموعة خوادم
الاستخدام التجاري مسموح به بموجب اتفاقية Nvidia Open Model
النموذج متاح على Hugging Face وعبر Nvidia NIM
تتضمن المدخلات النصوص والصور والصوت والفيديو والمستندات والواجهات الرسومية

لماذا هذا بالنسبة لإن‌فيديا

على مدى السنتين الماضيتين، فازت إن‌فيديا بشكل أساسي كمزود للبنية التحتية: وحدات معالجة الرسومات والشبكات و CUDA وكل البرامج من حولها. لكن عائلة Nemotron أصبحت بالفعل اتجاهاً منفصلاً، والآن تقوم الشركة بخطوة أكثر جرأة — تضع نموذجها الخاص كأساس جاهز للعوامل الذكية الصناعية. المنطق بسيط: إذا كان النموذج محسناً لأجهزة إن‌فيديا، وكانت الأجهزة محسنة لنماذج إن‌فيديا، تحصل الشركة على السيطرة على كل شيء تقريباً في المكدس، مثل Google و Amazon أو Microsoft في نظام البيئة السحابية الخاص بهم.

هذا هو السبب في أن الإصدار لا يتم تقديمه كعرض توضيحي للقدرات المختبرية، بل كمنتج للنشر. من بين المستخدمين والشركاء الأوائل، تذكر إن‌فيديا Foxconn و Palantir و Aible و ASI و Eka Care و H Company؛ وتقيم Dell و DocuSign و Infosys و Oracle و Zefr النموذج للإنتاج. السيناريوهات أيضاً ليست موجهة للمستهلك: الفحص البصري في المصانع، معالجة المستندات، العوامل الصوتية وفهم الشاشة لأنظمة computer-use.

يمكن نشر النموذج عبر Amazon SageMaker JumpStart و OpenRouter و vLLM و SGLang و Ollama و llama.cpp و TensorRT-LLM — لذا تريد إن‌فيديا جعله متاحاً في أي مكدس مألوف. مقابل المنافسين، يبدو الرهان دقيقاً جداً.

Google لديها Gemini متعددة الوسائط و Gemini Nano للأجهزة، لدى Meta مجموعة قوية من Llama، تبقى OpenAI المعيار التجاري مع نماذج GPT. لكن إن‌فيديا تحاول تجميع مزيج نادر من أربع خصائص في نفس الوقت: تعدد الوسائط والأوزان المفتوحة والترخيص التجاري والتشغيل على أجهزة الحافة دون متطلبات مقياس السحابة. إذا نجح هذا، ستتمكن الشركة من الحصول على قيمة في ثلاثة مستويات في نفس الوقت — الأجهزة وأدوات الاستدلال والنموذج نفسه.

ما معنى هذا

Nemotron 3 Nano Omni هو رهان على أن الموجة التالية من العوامل الذكية ستعمل ليس فقط في السحابة بل أيضاً محلياً، أقرب إلى البيانات والكاميرات والميكروفونات والواجهات المؤسسية. إذا أكدت إن‌فيديا الأرقام المذكورة في عمليات النشر الفعلية، ستصبح ليس مجرد مزود "معاول وبقايا" لطفرة الذكاء الاصطناعي، بل أحد أقوى اللاعبين في سوق النماذج نفسها.

Hamidun News

أخبار الذكاء الاصطناعي بدون ضوضاء. اختيار تحريري يومي من أكثر من 50 مصدر. منتج من جمال حميدون، رئيس الذكاء الاصطناعي في Alpina Digital.

قناة Telegram RSS hamidun.com

هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟

AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.

🎓 Academy — 7 أيام مجاناً استشارة مجانية

أطلقت Nvidia نموذج Nemotron 3 Nano Omni — نموذج متعدد الأنماط مفتوح المصدر لوكلاء الحافة

ما الذي يستطيع النموذج فعله

لماذا هذا بالنسبة لإن‌فيديا

ما معنى هذا

هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟

أهم ما في عالم الذكاء الاصطناعي — مرة كل أسبوع