MarkTechPost→ المصدر

NVIDIA تكشف عن SANA-WM: نموذج لفيديوهات مدتها 60 ثانية بدقة 720p على GPU واحد

كشفت NVIDIA عن SANA-WM، وهو نموذج مفتوح لتوليد الفيديو مع تحكم دقيق بالكاميرا. ينشئ النموذج فيديوهات مدتها دقيقة واحدة بدقة 720p ويمكن تشغيله على RTX 5090 واحدة

NVIDIA تكشف عن SANA-WM: نموذج لفيديوهات مدتها 60 ثانية بدقة 720p على GPU واحد
المصدر: MarkTechPost. كولاج: Hamidun News.
◐ استمع للمقال

قدمت NVIDIA نموذج SANA-WM — نموذج عالم مفتوح المصدر لإنشاء الفيديوهات مع التحكم بالكاميرا. يقوم النموذج بإنشاء فيديوهات مدتها 60 ثانية بدقة 720p مع تحكم دقيق بـ 6 درجات حرية ويمكنه العمل على معالج واحد من نوع RTX 5090.

كيف يعمل SANA-WM

SANA-WM هو ما يُعرّف بنموذج العالم، أي محاكي للعالم المادي. بدلاً من ربط الصور معاً في فيديو، يتعلم النموذج كيف يستجيب العالم المادي للإجراءات: إذا أدرتَ الكاميرا لليسار، فإن الأجسام في الإطار تتحرك بشكل صحيح. يحتوي النموذج على 2.6 مليار معامل وتم تدريبه على 64 معالج H100.

القدرات الرئيسية لـ SANA-WM:

  • إنشاء فيديوهات مدتها 60 ثانية بدقة 720p (1280×720)
  • التحكم الدقيق بالكاميرا من خلال تحكم 6 درجات حرية (الموضع والاتجاه)
  • العمل على معالج واحد من نوع RTX 5090 بدون خدمات سحابية
  • رمز مفتوح المصدر للتجريب والتكيف
  • دعم التوسع: من البحث العلمي إلى الإنتاج

لماذا هذا مهم لمنشئي الفيديو

قبل SANA-WM، كانت مولدات الفيديو إما خدمات سحابية (مكلفة) أو تتطلب معدات متخصصة. SANA-WM يغير هذا: يعمل محلياً وسريعاً وبدون اشتراكات. يمكن لاستوديو أن ينشئ سيناريوهات فيديو وتصورات إطار تلو الآخر ومسودات في دقائق، بدون الاعتماد على السحابة.

بالنسبة للمخرجين والرسامين، هذا يعني القدرة على اختبار أفكار لوحات القصة البصرية بسرعة. بالنسبة لفناني الرسوميات ثلاثية الأبعاد — طريقة لأتمتة إنشاء انتقالات الكاميرا في المشاهد المعقدة. بالنسبة لمتخصصي التسويق — إنشاء سريع لمقطع ترويجي بديناميكيات الحركة والزوايا المراقبة المطلوبة.

ما يعنيه هذا

يرمز SANA-WM إلى الانتقال من مولدات الفيديو المستندة إلى السحابة إلى الأدوات المحلية. تماماً كما جعل معالج الرسوميات العرض ثلاثي الأبعاد متاحاً على كل حاسوب، تبدأ نماذج العالم بجعل إنشاء الفيديوهات متاحاً. بالنسبة للصناعة، هذا هو تسريع اعتماد الذكاء الاصطناعي في العمليات الإبداعية — ليس لأن النماذج أصبحت أكثر ذكاءً فجأة، بل لأنها يمكنها الآن العمل في كل مكان.

ZK
Hamidun News
أخبار الذكاء الاصطناعي بدون ضوضاء. اختيار تحريري يومي من أكثر من 400 مصدر. منتج من جمال حميدون، رئيس الذكاء الاصطناعي في Alpina Digital.
ما رأيك؟
جارٍ تحميل التعليقات…