كيف استبدل كاتب على Habr البرومبتات بصور مرجعية في ChatGPT وأنشأ سلسلة من لوحات AI
استعرض Habr أسلوبًا عمليًا لتوليد الصور: بدلًا من الأوصاف الطويلة، بدأ الكاتب برفع ثلاث صور مرجعية إلى النموذج — الشخصية والملابس والمشهد. هذا الأسلوب منح…
معالج بواسطة الذكاء الاصطناعي من Habr AI؛ بتحرير Hamidun News
نُشِر على Habr دراسة حالة مفصّلة حول كيفية تحول تجربة تصميمية بطباعات هوكي إلى نموذج عملي لتوليد الصور بالذكاء الاصطناعي. الفكرة الأساسية بسيطة: بدلاً من تحسين تعليمات نصية لا نهائياً، بدأ المؤلف بإظهار النموذج بالضبط ما يجب رسمه.
كيف تغيرت العملية
في البداية، تم تصور المشروع كسلسلة من القمصان برسومات ملحمية لاعبي هوكي مشهورين. كان يستند على نماذج أولية مثل "ألكسندر أوفيتشكين — الملاك الحارس" و"إيفجيني مالكين — سيد العاصفة"، وضمت المجموعة النهائية ستة لاعبين: أوفيتشكين وبانارين وبوبروفسكي وداتسيوك وسيرغاتشيف ومالكين. خلال العمل، تخلى المؤلف عن بعض الرياضيين الأجانب: من ناحية، أرادوا أن تكون المجموعة أكثر فهماً للجمهور الروسي، ومن ناحية أخرى، لم تكن جميع الشخصيات متساوية في قابليتها للتوليد بالأسلوب المطلوب.
قبل ذلك، بدا سير العمل مألوفاً لأي شخص يعمل مع الرسومات التوليدية: أولاً، شرح مفصل للمهمة إلى ChatGPT، ثم كتابة تعليمات لنموذج محدد، ثم التوليد والتحسين وتصحيح الألوان والتنظيف اليدوي في Photoshop. لزيادة الدقة، استخدم المؤلف في البداية AI Photo & Art Enhancer، ثم انتقل إلى Topaz؛ للتنسيق — Luminar AI. لكن النهج القائم على التحكم النصي فقط كان له حد أقصى: حتى التعليمات المفصلة جداً لم تضمن الوضعية الدقيقة للشخصية أو العناصر المحددة للزي أو الأرقام أو الأوسمة وغيرها من التفاصيل الحاسمة للسلع.
لماذا نجعت المراجع
كانت نقطة التحول هي الانتقال إلى إدراج متعدد الوسائط. بدلاً من تعليمة نصية واحدة، بدأ المؤلف بتجميع طلب من ثلاثة أنواع من بيانات الإدخال: صور البطل نفسه وصور الملابس أو المعدات ومرجع منفصل للبيئة ومزاج المشهد. بعبارة أخرى، كان النموذج يتلقى ليس فقط وصفاً للحبكة، بل أيضاً قيوداً بصرية كان يتعين محاولة "التعبير عنها بالكلمات" سابقاً. هذا قلل بشكل حاد من عدد الانحرافات العشوائية في الوضعية والشكل والرمزية والتكوين.
- صورة الشخصية الرئيسية
- مرجع الزي أو الملابس أو المعدات
- صورة منفصلة تتضمن المشهد والأجواء المطلوبة
- موجز نصي يتضمن النموذج الأولي والإجراء وتفاصيل التكوين
من أجل الاختبارات، انتقل المؤلف إلى arena.ai، حيث يمكنك تشغيل عدة نماذج صور قوية مجاناً ومقارنة النتائج في وضع المقابلة الجنب إلى جنب. تذكر دراسة الحالة على وجه التحديد gemini-3-pro-image-preview-2k، وتسمى أيضاً nano-banana-pro، و gpt-image-1.5-high-fidelity. وفقاً للمؤلف، قدمت هذه أكثر النتائج إقناعاً مع معالجة لاحقة ضئيلة. كان من الفوائد الإضافية فترات توقف قصيرة نسبياً بعد الوصول إلى الحدود المجانية — حوالي 30-40 دقيقة، وهذا أكثر ملاءمة بشكل ملحوظ للعمل التكراري من العديد من البدائل.
باستخدام مثال صورة إيفجيني مالكين — The Stormbringer، أظهر المؤلف كيف يعمل النهج الجديد في الممارسة. في التعليمات، طُلب من النموذج دمج ثلاثة مراجع مرفوعة وتحويل مالكين إلى سيد أسطوري لعاصفة جليدية: مع سماء عاصفة فوق الحلبة وشقوق في الجليد وعصا تعمل كموصل برق والقرص يشبه البرق الكروي. لم يعد هذا الطلب يحاول وصف كل شيء من البداية — فهو يحدد إطاراً ويسمح للنموذج بتجميع الصورة المطلوبة بشكل أكثر دقة من الأمثلة البصرية المعروضة مسبقاً.
ما أصبح عليه المشروع
نتيجة لذلك، تطورت التجربة إلى مجموعة كاملة THE HOCKEY GODS SERIES. لكل لاعب، ابتكر المؤلف صورة منفصلة: أصبح بافيل داتسيوك The Hockey Magician وسيرجي بوبروفسكي The Man-Fortress وألكسندر أوفيتشكين The Archangel وميخائيل سيرغاتشيف The Ice Warden وأرتيمي بانارين The Trickster وإيفجيني مالكين The Stormbringer. تم إنشاء شعار السلسلة بمساعدة ChatGPT، ثم تم تحويله من صورة نقطية إلى متجه من خلال Adobe Illustrator حتى يتمكن من التحجيم بدون فقدان الجودة.
في البداية، تم اعتبار المشروع تجارياً: كان المؤلف يفكر في بيع المجموعة من خلال منصات طباعة السلع. لكن الحساب تبين أنه غير ملهم — هوامش منخفضة وبيروقراطية التسجيل والمراجعة اليدوية للتصاميم جعلت المشروع ثقيلاً من الناحية التشغيلية. في وقت ما، غيّر المشروع هدفه: بدلاً من محاولة تحقيق عوائد، قرر المؤلف إطلاق المواد للعامة، بما في ذلك ملفات التخطيط الأصلية في Adobe InDesign والإصدارات الكبيرة بصيغة JPEG والشعار بصيغ متعددة.
"أحياناً يكون من الأكثر إثارة عدم بيع فكرة، بل تركها تطفو بحرية."
ما يعنيه هذا
تُظهِر دراسة الحالة بشكل جيد إلى أين ينتقل العمل العملي مع رسومات الذكاء الاصطناعي في عام 2026. الفائزون ليسوا الذين يملكون أطول التعليمات، بل مزيج من النصوص والمراجع والمقارنة السريعة للنماذج في مهمة واحدة. بالنسبة للمصممين والفرق التحريرية ومنشئي السلع، هذا إشارة مهمة: يمكن بالفعل استخدام نماذج الصور الحديثة ليس فقط لاستكشاف الأجواء، بل كأداة للإنتاج المُتحكَّم فيه إذا قمت بتجميع السياق البصري بشكل صحيح في المدخلات.
هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟
AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.