AWS Machine Learning Blog→ المصدر

NVIDIA تطلق Nemotron 3 Nano Omni على Amazon SageMaker JumpStart يوم الإطلاق

جعلت NVIDIA Nemotron 3 Nano Omni متاحة على Amazon SageMaker JumpStart يوم الإطلاق. يجمع النموذج معالجة النصوص والصور والصوت والفيديو في خط أنابيب استدلال…

معالج بواسطة الذكاء الاصطناعي من AWS Machine Learning Blog؛ بتحرير Hamidun News
NVIDIA تطلق Nemotron 3 Nano Omni على Amazon SageMaker JumpStart يوم الإطلاق
المصدر: AWS Machine Learning Blog. كولاج: Hamidun News.
◐ استمع للمقال

في 28 أبريل 2026، أضافت NVIDIA نموذج Nemotron 3 Nano Omni متعدد الأنماط إلى Amazon SageMaker JumpStart في يوم إطلاقه. بالنسبة للفرق على AWS، هذا يختصر المسار من إعلان النموذج إلى المشروع التجريبي: الخدمة جاهزة بالفعل للنشر وتشغيل الاستدلال.

ما هو هذا النموذج

Nemotron 3 Nano Omni هو نموذج لغة كبير متعدد الأنماط مفتوح المصدر بـ 30 مليار معامل إجمالي و 3 مليارات معامل نشط. مبني على معمارية هجينة Mamba2 Transformer Hybrid Mixture of Experts. جمعت NVIDIA النموذج من ثلاثة مكونات: نواة اللغة Nemotron 3 Nano، ومشفر الرؤية البصرية CRADIO v4-H للصور والفيديو، ومشفر الكلام Parakeet للصوت.

يقبل النموذج الفيديو والصوت والصور والنص كمدخلات ويعيد استجابات نصية كمخرجات. وفقاً لتوثيق AWS، النموذج مصمم ليس فقط للدردشة بل أيضاً لسيناريوهات الوكلاء الذكيين. يدعم نافذة سياق تصل إلى 131 ألف رمز، والاستدلال، واستدعاء الأدوات، واستجابات JSON، وطوابع زمنية على مستوى الكلمات للنسخ.

في SageMaker JumpStart، النموذج متاح بصيغة FP8، مما يركز على التوازن بين الجودة والكفاءة. من حيث الترخيص، وهو مهم للاستخدام التجاري، يتم توزيع Nemotron 3 Nano Omni بموجب اتفاقية NVIDIA للنماذج المفتوحة.

النموذج مخصص لـ "الرؤية والاستماع والتفكير" عبر عدة أنماط في مسار استدلال واحد.

حيث يكون النموذج مفيداً

الفكرة الرئيسية للإعلان هي القضاء على مجموعة متنوعة من النماذج المنفصلة للرؤية والكلام والنص. في نظام وكيل مؤسسي نموذجي، كل وحدة من هذه تضيف كمون، وتعقد التنسيق، وتكسر السياق الشامل. تقترح AWS و NVIDIA استخدام Nemotron 3 Nano Omni كطبقة إدراك موحدة: يقرأ النموذج الشاشة، ويفهم المستندات، وينسخ الكلام، ويحلل الفيديو، بينما تعمل بقية منطق الوكيل على صورة موحدة واحدة متسقة.

  • وكلاء الحاسوب التي تتنقل عبر الواجهات واللوحات المعلومات والمتصفحات
  • ذكاء المستندات للعقود والاتفاقيات والمستندات المالية والجداول واللقطات
  • تحليل المكالمات والاجتماعات والمحتوى الآخر للصوت والفيديو في خدمات الدعم
  • التحقق من الأحداث البصرية، مثل الشحنات أو الطلبات، حيث يكون OCR والسياق الزمني ضروريين

للنموذج حدود إدخال واضحة جداً، وتبدو عملية بالفعل للمشاريع التجريبية. الفيديو — MP4 بحد أقصى دقيقتين وحتى 256 إطاراً، الصوت — WAV أو MP3 بمدة تصل إلى ساعة واحدة، الصور — JPEG و PNG، النص — حتى 131 ألف رمز. هذا ليس آلة عالمية غير محدودة، لكن بالنسبة للمساعدين الداخليين وأنابيب المراجعة وأتمتة المهام التشغيلية، النطاق أكثر من كافٍ. في الخلاصة، تعلن AWS بشكل منفصل عن معدل إنتاجية أعلى بـ 9 مرات مقارنة بنماذج omni المفتوحة البديلة.

كيفية تشغيل النموذج

يقدم SageMaker JumpStart هذا الإصدار كنشر بنقرة واحدة. السيناريو الأساسي بسيط: فتح SageMaker Studio، والانتقال إلى قسم JumpStart، والعثور على Nemotron 3 Nano Omni، واختيار بطاقة النموذج، والنقر على Deploy. قبل ذلك، تطلب AWS منك التحقق من ثلاثة أشياء: توفر الحساب، وأذونات الوصول إلى JumpStart، وحصص مثيلات GPU مثل ml.

p4d.24xlarge أو ml.p5.

48xlarge. إذاً هناك بداية سريعة، لكنها لا تزال تعتمد على جاهزية البنية التحتية للمؤسسة وميزانية GPU. بالنسبة للفرق التي تنشر النماذج عبر التعليمات البرمجية، هناك أيضاً مسار عبر SageMaker Python SDK مع معرّف نموذج جاهز.

بعد النشر، يقبل نقطة النهاية الطلبات متعددة الأنماط: يمكنك وصف صورة أو تلخيص تسجيل اجتماع أو نسخ مكالمة مع تسليط الضوء على عناصر الإجراء. توصي AWS أيضاً بوضعي استدلال: thinking للاستدلال المعقد مع درجة حرارة 0.6 و top_p 0.

95 و max_tokens 20480، و instruct للمهام الأكثر مباشرة حيث تكون السرعة مهمة. بعد التجارب، من الأفضل حذف نقطة النهاية على الفور لتجنب تراكم التكاليف الإضافية.

ما يعنيه هذا

ظهور Nemotron 3 Nano Omni في JumpStart في يوم الإطلاق يظهر أن AWS تسارع في توفير نماذج مفتوحة جديدة مباشرة في سير العمل الإنتاجي. بالنسبة للعمل، هذا إشارة إيجابية: تنتقل الوكلاء الذكيين متعددو الأنماط تدريجياً من مجموعة من المكونات المشتتة إلى مكدس منتج أكثر تماسكاً يمكن اختباره على بيانات خاصة بك دون تجميع طويل من الصفر.

ZK
Hamidun News
أخبار الذكاء الاصطناعي بدون ضوضاء. اختيار تحريري يومي من أكثر من 400 مصدر. منتج من جمال حميدون، رئيس الذكاء الاصطناعي في Alpina Digital.

هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟

AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.

ما رأيك؟
جارٍ تحميل التعليقات…