MarkTechPost→ المصدر

ByteDance تقدم Lance: نموذج واحد لفهم وتوليد وتحرير الفيديو

قدمت ByteDance نموذج Lance - نموذج متعدد الأنماط للعمل مع الفيديو والصور. إطار عمل واحد يعالج الفهم والتوليد والتحرير للمحتوى البصري بشكل متزامن. يستخدم…

معالج بواسطة الذكاء الاصطناعي من MarkTechPost؛ بتحرير Hamidun News
ByteDance تقدم Lance: نموذج واحد لفهم وتوليد وتحرير الفيديو
المصدر: MarkTechPost. كولاج: Hamidun News.
◐ استمع للمقال

قدمت ByteDance نموذج Lance - نموذج متعدد الأنماط مفتوح المصدر يجمع بين الفهم والتوليد والتحرير للصور والفيديو في إطار عمل واحد.

كيفية عمل Lance

Lance هو نموذج موحد متعدد الأنماط محلي، أنشأته مختبر الإنشاء الذكي في ByteDance. الفرق الرئيسي: تعمل جميع الأنماط الثلاثة (الفهم والتوليد والتحرير) في إطار عمل واحد، دون الحاجة للتبديل بين نماذج مختلفة.

في نفس الوقت، يستخدم النموذج 3 مليارات معامل نشط فقط - صغير الحجم بما يكفي للنشر على أجهزة المستهلك. يوفر النهج المعماري الموحد عدة مزايا: دمج أسهل في التطبيقات، أداء أسرع، يتطلب ذاكرة وحوسبة أقل من مجموعة من النماذج المتخصصة.

كان المسار التقليدي يتطلب ثلاثة نماذج مختلفة - واحد للتحليل وثاني لإنشاء المحتوى وثالث للتحرير. يجمع Lance كل هذا في أداة واحدة.

ما الذي يمكن لـ Lance القيام به

يتعامل مع مجموعة واسعة من المهام المتعلقة بالفيديو والصور:

  • فهم المحتوى — تحليل محتوى الفيديو والصور والتعرف على الكائنات والمشاهد
  • التوليد — إنشاء صور وفيديو جديدة بناءً على الأوصاف النصية
  • التحرير — تعديل المحتوى البصري الموجود وإعادة صياغة المشاهد واستبدال الكائنات
  • العمل عبر الأنماط — معالجة الفيديو والصور في نفس الوقت دون فقدان الجودة
  • متطلبات النظام المنخفضة — 3 مليارات معامل كافية للعمل في الوقت الفعلي

يعني الكود المفتوح أن المطورين والباحثين لا يمكنهم فقط استخدام النموذج الجاهز، بل يمكنهم أيضاً تكييفه لمهام محددة - من إنشاء مساعدات صور شخصية إلى التكامل في التطبيقات التجارية.

أهمية هذا للصناعة

يؤكد إطلاق Lance على اتجاه نراقبه في عام 2026: أصبحت النماذج متعددة الأنماط معياراً وليس غرابة. ByteDance، مثل OpenAI (مع Operator) و Google (مع حلولهم متعددة الأنماط)، تتجه نحو أنظمة متكاملة تعمل ليس مع نوع واحد من البيانات، بل مع جميع الأنواع في نفس الوقت.

هذا ليس مجرد تحسين تقني - بل هو تحول في فلسفة تصميم أنظمة الذكاء الاصطناعي.

النقطة الرئيسية: اختارت الشركة استراتيجية الكود المفتوح، مما يوفر

لمجتمع المطورين الوصول إلى التكنولوجيا التي كان يتعين عليهم بناء نظام خاص بهم من الصفر قبل عام واحد.

عملياً، هذا يعني أن الشركات الناشئة والفرق يمكنها الآن بسرعة إنشاء نماذج أولية من التطبيقات التوليدية بالفيديو والصور، دون الاستثمار في البحث والتطوير المكلف. يخفض Lance حاجز الدخول إلى مجال الذكاء الاصطناعي التوليدي.

ماذا يعني هذا

يوضح Lance أن عصر النماذج المتخصصة ينتمي إلى الماضي. المستقبل يتعلق بأداة واحدة تفهم وتوليد وتحرر كل شيء في نفس الوقت. بالنسبة للمطورين، هذا تبسيط، وبالنسبة للمستخدمين، تجربة أفضل، وبالنسبة لـ ByteDance، ميزة تنافسية في المنافسة على موقع السوق في قطاع الذكاء الاصطناعي التوليدي.

ZK
Hamidun News
أخبار الذكاء الاصطناعي بدون ضوضاء. اختيار تحريري يومي من أكثر من 400 مصدر. منتج من جمال حميدون، رئيس الذكاء الاصطناعي في Alpina Digital.

هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟

AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.

ما رأيك؟
جارٍ تحميل التعليقات…