Jiqizhixin (机器之心)→ المصدر

Vidu Q2: الآن الذكاء الاصطناعي ينسخ ليس فقط الصورة، بل لعبة الممثل أيضاً

فيدو Q2: الآن الذكاء الاصطناعي ينسخ ليس فقط الصورة، بل الأداء التمثيلي أيضاً بينما ينتظر المجتمع العالمي بترقب على الأقل إصدار بيتا مغلق من Sora من OpenAI،…

معالج بواسطة الذكاء الاصطناعي من Jiqizhixin (机器之心)؛ بتحرير Hamidun News
Vidu Q2: الآن الذكاء الاصطناعي ينسخ ليس فقط الصورة، بل لعبة الممثل أيضاً
المصدر: Jiqizhixin (机器之心). كولاج: Hamidun News.
◐ استمع للمقال

فيدو Q2: الآن الذكاء الاصطناعي ينسخ ليس فقط الصورة، بل الأداء التمثيلي أيضاً

بينما ينتظر المجتمع العالمي بترقب على الأقل إصدار بيتا مغلق من Sora من OpenAI، قررت مجموعة من المطورين الصينيين من شركة Shengshu Technology أن عهد مقاطع الفيديو الجميلة للعروض التوضيحية قد انتهى. استطاع مشروعهم Vidu بالفعل أن يثبت نفسه كمنافس جاد في سوق الفيديو التوليدي، إلا أن التحديث الجديد Q2 مع ميزة Reference Pro يرفع اللعبة إلى مستوى مختلف تماماً.

المشكلة الرئيسية في فيديو الشبكة العصبية اليوم هي غياب التحكم. يمكنك الحصول على إطار مذهل، لكن إجبار الشبكة العصبية على تكراره بنفس الشخصية أو بنفس الأسلوب يكاد يكون مستحيلاً. يحاول Vidu Q2 حل هذه المشكلة بتقديم أداة للمستخدمين تُسمى في الصناعة بالاتساق.

جوهر ميزة Reference Pro هو أنك لا تقتصر على كتابة طلب نصي والأمل في الحظ. بل تزود النموذج بمرجع. قد يكون هذا صورة شخصية أو تأثير بصري محدد أو حتى مقطع فيديو يحتوي على حركات يجب نسخها. تحلل الشبكة العصبية المرجع و"تمتص" خصائصه. في أوساط التكنولوجيا الصينية، يطلق على هذا اسم تأثير الانغمار الكامل في السياق.

هذا يسمح بالحفاظ على وجه الشخصية دون تغيير طوال عدة مشاهد، وهو كان حتى وقت قريب الصداع الرئيسي لأي شخص يحاول تجميع فيلم قصير كامل أو إعلان تجاري من أجزاء الشبكة العصبية. من الناحية التقنية، استطاعت شركة Shengshu Technology تحقيق فصل خصائص النمط والمحتوى في الفضاء الكامن للنموذج. هذا يعني أنك تستطيع أخذ رقصة معقدة من مقطع فيديو واحد ونقلها إلى شخصية مختلفة تماماً في بيئة مختلفة، مع الحفاظ على الفيزياء والديناميكية للأصل. هذا ليس مجرد تراكب قناع، بل إعادة تجميع كاملة للمشهد مع الأخذ في الاعتبار المتغيرات الجديدة.

يجعل هذا النهج Vidu Q2 ليس مجرد لعبة لتوليد الميمات، بل أداة عمل حقيقية الكاملة للوكالات الإبداعية والاستوديوهات الصغيرة التي لا تملك ميزانية لرسومات كاملة لكن لديها طلب على الجودة.

لماذا هذا مهم الآن تحديداً؟ نشهد تحولاً في سوق محتوى الذكاء الاصطناعي. المرحلة الأولى من "تأثير الدهشة"، عندما كنا مندهشين من مجرد إمكانية إحياء صورة، انتهت رسمياً. وصلنا إلى مرحلة البراغماتية. المحترفون لا يحتاجون إلى روائع عشوائية؛ هم يحتاجون إلى أدوات تنفذ المواصفات التقنية. تفهم الشركات الصينية مثل Shengshu Technology ومنشئو Kling هذا بشكل أفضل من غيرهم. بينما تغوص الشركات الغربية الكبرى في مشاكل قانونية وتصفية أخلاقية، يقوم المطورون الشرقيون بإنشاء ميزات تطبيقية تغير سلسلة إنتاج المحتوى الآن وهنا.

من المثير للاهتمام أيضاً كيف يتعامل Vidu مع التفاصيل. تسمح ميزة Reference Pro بنسخ حتى الأنظمة الإضاءة المعقدة والقوام. إذا كان لديك في مرجعك إضاءة غروب شمس ناعمة وحبيبية فيلم معينة، سينقل النموذج هذا المناخ إلى النتيجة النهائية بدقة مثيرة للإعجاب. هذا يهدد الطرق التقليدية لما بعد معالجة الفيديو، حيث يمكن الآن حل العديد من المهام في مرحلة التوليد. نشهد انخفاض حاجز الدخول لإنتاج فيديو عالي الجودة بسرعة، و Vidu Q2 هو أحد المحركات الرئيسية لهذه العملية.

بالطبع، تبقى هناك أسئلة حول حقوق الطبع والنشر وكيفية استخدام مثل هذه الأدوات لإنشاء ديب فيك، لكن التقدم التكنولوجي لا يمكن إيقافه. يضع Vidu Q2 Reference Pro معياراً جديداً للقابلية للتحكم يجب أن تسعى إليه Luma و Runway وخاصة OpenAI حتماً. في عالم حيث يمكن لأداة "ذكية" أن تنسخ أداء تمثيلي أو أسلوب بصري معقد في دقائق، تصبح قيمة الفكرة أعلى من قيمة التنفيذ التقني.

المقياس الحقيقي: Vidu Q2 يحول توليد الفيديو من يانصيب إلى عملية محكومة، موجهة نحو منشئي محتوى احترافيين. هل يستطيع Sora تقديم شيء أكثر وظيفية من مجرد صور جميلة عندما يتم إطلاقه أخيراً؟

ZK
Hamidun News
أخبار الذكاء الاصطناعي بدون ضوضاء. اختيار تحريري يومي من أكثر من 400 مصدر. منتج من جمال حميدون، رئيس الذكاء الاصطناعي في Alpina Digital.

هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟

AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.

ما رأيك؟
جارٍ تحميل التعليقات…