Jiqizhixin (机器之心)→ المصدر

Sora 2: مشروع صيني يكسر احتكار الشبكات العصبية المغلقة

نحن نعيش منذ ما يقرب من سنة واحدة في واقع حيث عرّفتنا OpenAI على مستقبل توليد الفيديو، لكنها لم تسمح لنا باللمس فيه. بينما يقوم سام ألتمان وفريقه بإطعام…

معالج بواسطة الذكاء الاصطناعي من Jiqizhixin (机器之心)؛ بتحرير Hamidun News
Sora 2: مشروع صيني يكسر احتكار الشبكات العصبية المغلقة
المصدر: Jiqizhixin (机器之心). كولاج: Hamidun News.
◐ استمع للمقال

نحن نعيش منذ ما يقرب من سنة واحدة في واقع حيث عرّفتنا OpenAI على مستقبل توليد الفيديو، لكنها لم تسمح لنا باللمس فيه. بينما يقوم سام ألتمان وفريقه بإطعام الصناعة بعروض مثيرة على وسائل التواصل الاجتماعي، ويبقى الوصول إلى Sora الأصلية امتيازاً لدائرة ضيقة من مخرجي هوليوود، قررت الشرق السير في طريق آخر. قام اتحاد مراكز التكنولوجيا الصينية Chuangzhi و Mosi بإطلاق مشروع بمسمى طموح: Sora 2. وهذا ليس مجرد محاولة أخرى لنسخ النجاح الغربي، بل بيان حقيقي للانفتاح قد يهز الهرمية المستقرة في عالم الفن التوليدي.

لفترة طويلة، كان إنشاء فيديو عالي الجودة باستخدام الذكاء الاصطناعي يشبه تجميع مجموعة بناء معقدة. كان عليك أولاً توليد محتوى بصري في نموذج واحد، ثم محاولة تراكب الصوت في نموذج آخر، وبعد ذلك—مزامنة مؤلمة لحركات الشفاه أو أصوات الخطوات مع الصورة. يحل Sora 2 هذه المشكلة بأناقة وجذرية. قام المطورون بتنفيذ معمارية تسمح بتوليد الصوت والفيديو في نفس الوقت، مما يوفر تلك المزامنة «السينمائية» التي كان يمكن حلمنا بها فقط. وهذا يحول الشبكة العصبية من لعبة ممتعة إلى أداة حقيقية لإنتاج المحتوى، حيث لا يعود الصوت ملحقاً ثانوياً.

لا يمكن تجاهل السياق العام لهذا الإطلاق. لقد أثبتت شركات صينية مثل Kling و Luma أنها يمكن أن تتنافس مع قادة وادي السيليكون في جودة الصور. ومع ذلك، تبقى معظم هذه الخدمات مغلقة أو تعمل بنموذج اشتراك مدفوع. إطلاق Sora 2 بصيغة مفتوحة المصدر—هذا تحد مباشر للاحتكار. يمكن مقارنة هذا الحدث باللحظة التي تم فيها إطلاق Stable Diffusion، والتي انتزعت في حينها سوق توليد الصور من يد DALL-E المغلقة. الآن، لدى الباحثين والمطورين المستقلين في جميع أنحاء العالم إمكانية الوصول إلى أوزان النموذج، مما سيؤدي حتماً إلى انهيار من المكونات الإضافية الجديدة والتحسينات والتجارب الإبداعية.

يعتمد التنفيذ التقني لـ Sora 2 على محولات الانتشار المتقدمة (DiT)، والتي أصبحت معيار الصناعة بعد نجاح الأعمال الأصلية لـ OpenAI. لكن المهندسين الصينيين ذهبوا أبعد من ذلك في تحسين موارد الحوسبة. وعلى الرغم من الدقة العالية وتعقيد المشاهد، يُظهر النموذج استقراراً مذهلاً للإطارات. وهذا حاسم للاستخدام الاحترافي، حيث أن أي «انجراف في الأنسجة» أو اختفاء مفاجئ للأجسام يحول مشروعاً جاداً إلى كابوس نفسي. يحافظ Sora 2 على هيكل الإطار بثقة، مما يسمح بإنشاء لقطات طويلة تبدو متماسكة من الثانية الأولى إلى الأخيرة.

ماذا يعني هذا للسوق على المدى الطويل؟ أولاً، ينخفض الحد الأدنى للدخول إلى صناعة إنتاج الفيديو بشكل أكبر. الآن لدى استوديوهات الإنديز الصغيرة أداة كانت تتطلب سابقاً ميزانيات ضخمة للعرض وتصميم الصوت. ثانياً، تقع OpenAI و Runway الآن في موقع اللاحقين من حيث الانفتاح. سيتعين عليهما إما فتح تقنياتهما أو تقديم شيء متفوق بشكل جذري من حيث الجودة لتبرير إغلاق النظم البيئية الخاصة بهما. لا تريد الصناعة أن تنتظر رحمة الشركات؛ تريد أدوات يمكن تشغيلها على خوادمها الخاصة وضبطها لمهامها الخاصة.

بالطبع، يحمل الانفتاح معه مخاطر معينة تتعلق بأمان المحتوى وحقوق الطبع والنشر. لكن التاريخ يُظهر أن التقدم في مجال الذكاء الاصطناعي يتسارع دائماً عندما توقفت التكنولوجيا عن أن تكون سراً لشركة واحدة. Sora 2 ليست مجرد محرر فيديو معزز؛ بل هي إشارة إلى السوق بأكملها بأن عصر «الصناديق السوداء» المغلقة يقترب من نهايته. بينما يبني العمالقة الغربيون جدراناً، تبني المجتمع الصيني جسوراً، ويمكننا أن نرى بالفعل نتائج هذه الاستراتيجية اليوم في شكل مقاطع فيديو عالية الجودة لا يمكن تمييزها عن عمل استوديو متخصص. الخلاصة: Sora 2 يجعل التكنولوجيا في متناول الجميع، والآن يتعين على OpenAI أن تبذل جهداً كبيراً جداً لإقناع العالم بقيمة نموذجها المغلق.

ZK
Hamidun News
أخبار الذكاء الاصطناعي بدون ضوضاء. اختيار تحريري يومي من أكثر من 400 مصدر. منتج من جمال حميدون، رئيس الذكاء الاصطناعي في Alpina Digital.

هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟

AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.

ما رأيك؟
جارٍ تحميل التعليقات…