أطلقت Sber نموذج Kandinsky 6.0 Image Pro — نموذج موحد لتوليد وتحرير الصور
قامت Sber بتحديث سلسلة Kandinsky وإطلاق 6.0 Image Pro — نموذج موحد لتوليد وتحرير الصور. وفقاً للشركة، يعمل بمستوى Flux 2 Max ويتفوق على GPT Image 1.5 وأسرع…
معالج بواسطة الذكاء الاصطناعي من Habr AI؛ بتحرير Hamidun News
أطلقت شركة Sber نموذج Kandinsky 6.0 Image Pro — وهو نموذج موحد جديد يجمع بين توليد وتحرير الصور. تركز الشركة ليس فقط على جودة توليد الصور من النصوص، بل بشكل أساسي على سيناريوهات التحرير الدقيق والمعقد.
ما تم تحديثه
تجمع النسخة الجديدة بين توليد الصور من النصوص والتحرير في نموذج واحد. وهذا تحول مهم مقارنة بخط Kandinsky 5 السابق، حيث كان التركيز موزعاً على عدة أوضاع ومتغيرات نماذج منفصلة. يصبح سيناريو المستخدم أقصر: يمكن استخدام نفس الأداة سواء للعرض الأول أو لتعديلات المشهد اللاحقة.
الآن تروج Sber منتج واحد رئيسي لكلا المهمتين — من إنشاء صورة من الصفر إلى استبدال الأجسام، وتصميم الصور، والتحرير المحلي للإطار النهائي. وفقاً للمقارنات الداخلية للشركة، يعرض Kandinsky 6.0 Image Pro مستوى يضاهي Flux 2 Max ويتفوق على GPT Image 1.
5. تؤكد Sber بشكل منفصل أن النموذج أصبح أكثر استقراراً في توليد الصور من النصوص، لكن التركيز الرئيسي للإصدار هو التحرير. لهذا الغرض، تم نقل البنية إلى MoE، وتم موازاة الاستدلال، وتحسين آلية الاهتمام.
ونتيجة لذلك، وفقاً للشركة، تعمل النسخة الجديدة بسرعة أكبر من 40% من السابقة.
وفقاً لنتائج المقارنات، يعمل
Kandinsky 6.0 Image Pro على مستوى Flux 2 Max ويتفوق على GPT Image 1.5.
لماذا يكون Image RAG ضرورياً
أحد التحديثات الرئيسية هو دمج Image RAG. بتبسيط، عندما يقوم المستخدم بطلب، يبحث النظام عن مراجع بصرية مناسبة في قاعدة المعرفة ويضيفها إلى سياق النموذج عند الحاجة. بفضل ذلك، يفهم المولد بشكل أفضل ليس فقط الأنماط والأجسام العامة، بل أيضاً التفاصيل الثقافية والتاريخية والمحلية الأضيق، والتي عادة ما تكون أصعب للنماذج العامة.
يجب أن يزيد هذا النهج من الدقة حيث تشعر النماذج التوليدية العادية بالارتباك من التفاصيل أو تستبدل الخصائص المحلية برموز نمطية أكثر. الفائدة العملية هي أن معرفة النموذج يمكن توسيعها دون إعادة تدريب كاملة. في المقالة، تقدم Sber أمثلة على كائنات الرمز الثقافي الروسي: يعيد النموذج بشكل صحيح الطلاء Mezenian وقبعة kartuz التقليدية الروسية والتفاصيل البصرية المحددة الأخرى.
تعمل نفس الآلية أيضاً في وضع التحرير. على سبيل المثال، يمكن للمستخدم إدراج نفسه في مشهد مع شخصيته السينمائية المفضلة إذا وجد النظام السياق البصري ذي الصلة ودمجه بشكل صحيح في الصورة.
حيث ستكون مفيدة
حالات الاستخدام لـ Kandinsky 6.0 Image Pro عملية تماماً. لا يتعلق الأمر بعد الآن فقط بتوليد صور جميلة من مطالبة، بل بتحرير الصور النهائية دون التعديل اليدوي في محرر الرسومات وبدون فقدان ملحوظ لتكامل المشهد. أي أن النموذج يتحول من شبكة عصبية توضيحية إلى أداة عمل للمصممين والمسوقين وفرق التجارة الإلكترونية والمهندسين المعماريين وجميع من يجرون بانتظام تعديلات بصرية سريعة.
- إزالة الأجسام والرسوم والنصوص مع الحفاظ على الخلفية
- استبدال الأجسام مع مراعاة أسلوب الإطار الأصلي
- تصميم الصور الشخصية مع الحفاظ على ملامح الوجه
- استعادة وتلوين الصور القديمة
- توليد الأفنية والمناطق الداخلية من الوصف أو تخطيط الغرفة
تُظهر المقالة أيضاً حالات حيث يساعد النموذج على تغيير الإضاءة والخلفية والتسريحة والمكياج والملابس وحتى تعبير الوجه. هناك أيضاً ذكر منفصل لدمج خدمة "الفوج الخالد على الإنترنت"، حيث يستخدم Kandinsky لاستعادة الصور الأرشيفية للمحاربين القدامى. هذا ليس بعد الآن مجرد وظيفة عرض للترويج، بل سيناريو عملي حيث يكون التحرير الحذر والنتائج القابلة للتنبؤ مهمة.
بالنسبة للسوق المحلية، هذا أحد أوضح الأمثلة على التطبيق العملي للتكنولوجيا. حالياً، Kandinsky 6.0 Image Pro متاح على منصات GigaChat: في Telegram وتطبيق Max والموقع giga.
chat وتطبيق Android. في التحديثات القادمة، تعد Sber بإضافة التحرير بثلاثة مراجع ووضع فرشاة أكثر تفصيلاً، حيث يمكن للمستخدمين الإشارة حرفياً إلى قسم من الصورة لتحديد بالضبط ما يجب إضافته أو إزالته. هذا يقرب المنتج من المنطق الأكثر سيولة للعمل في محررات الصور، لكن مع نموذج توليدي تحت الغطاء.
ما يعنيه ذلك
تنتقل نماذج توليد الصور الروسية بشكل متزايد من فئة "شاهد عرضاً توضيحياً" إلى فئة أدوات العمل. إذا حافظ Kandinsky 6.0 Image Pro بالفعل على السرعة والجودة المعلن عنها في الاستخدام الجماعي، فسيحصل السوق المحلية على أداة قوية أخرى للتصميم والتسويق والتجارة الإلكترونية واستعادة الصور الأرشيفية — خاصة حيث يكون السياق البصري الروسي مهماً.
هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟
AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.