Habr AI→ المصدر

تفكيك الـprompts في Gemini وKling: كيف تعيد إنشاء صورة من Pinterest بأسلوب العلامة التجارية

تفكيك الـprompt هو السر الرئيسي لتوليد الصور بدقة. بدلًا من prompt واحد طويل، يجب تقسيم المرجع إلى مكوّنات: الأجواء، لوحة الألوان، الإضاءة، الخامات، الأسلوب…

معالج بواسطة الذكاء الاصطناعي من Habr AI؛ بتحرير Hamidun News
تفكيك الـprompts في Gemini وKling: كيف تعيد إنشاء صورة من Pinterest بأسلوب العلامة التجارية
المصدر: Habr AI. كولاج: Hamidun News.
◐ استمع للمقال

إذا بدت نتيجة التوليد "جيدة تقريباً، لكن ليست صحيحة تماماً" — فالمشكلة في معظم الأحيان ليست في الأداة، بل في صياغة الطلب. شاركت مؤلفة من مجتمع الذكاء الاصطناعي الناطق بالروسية طريقة فعلية وملموسة: تحليل الطلب إلى طبقات دلالية منفصلة يسمح بتحقيق نتائج دقيقة في المحاولة الأولى أو الثانية — بدلاً من عشرات التكرارات العشوائية. الأدوات في المثال هي Gemini لتوليد الصور و Kling للرسوم المتحركة.

كانت نقطة البداية صورة من Pinterest. كانت المهمة غير بسيطة: ليس نسخ الصورة، بل تكييفها مع نمط العلامة التجارية للشركة — الحفاظ على الأجواء والتكوين العام مع استبدال الألوان والتفاصيل والجماليات بالكامل وفقاً لدليل العلامة التجارية. هنا يبدأ التحليل.

بدلاً من طلب واحد طويل، قسّمت المؤلفة الصورة الأصلية إلى مكونات منفصلة: المشهد العام والأجواء، لوحة الألوان، الإضاءة، القوام، نمط العرض، تفاصيل المقدمة والخلفية. تم وصف كل عنصر بشكل منفصل — بشكل متسلسل، طبقة تلو الأخرى، مع تحسين تدريجي للتفاصيل. استخدمت Gemini كأداة توليد.

المبدأ الأساسي للعمل ليس "تحميل كل شيء في طلب واحد والأمل"، بل حوار منظم مع تحسين متسلسل لكل عنصر. أولاً، يتم تحديد المشهد العام. ثم يتم تحسين النمط.

بعد ذلك، تُضاف تفاصيل العلامة التجارية: الألوان من الدليل، العناصر المميزة للهوية، الحلول البصرية المسموحة وغير المسموحة. يقلل هذا النهج عدد التكرارات بشكل حاد: يتلقى النموذج تعليمات واضحة بدلاً من محاولة تخمين القصد من وصف غامض. تستجيب النماذج متعددة الأنماط بشكل أفضل للوصفات المحددة بدلاً من التعريفات المجردة.

"غروب دافئ" ينتج عنه نتائج غير متوقعة. "إضاءة ذهبية برتقالية بزاوية 45 درجة، ظلال طويلة ناعمة" — يعمل بشكل متوقع. "أزرق مؤسسي بروح العلامة التجارية" — تعليمات غير واضحة.

"RGB 0، 82، 204، سطح لامع، بدون تدرجات" — بالفعل محدد. تحليل الطلب هو ترجمة صورة بصرية إلى لغة يفهمها النموذج بوضوح. بعد تجميع الصورة لمطابقة الهوية المطلوبة، دخل Kling في الخط — أداة لرسم الصور الثابتة متحركة بناءً على نماذج توليد الفيديو.

هنا أيضاً يعمل التحليل: يحدد الطلب بشكل منفصل ما يجب أن يتحرك، بأي سرعة، في أي اتجاه وبأي كثافة. طلب الرسوم المتحركة ليس وصفاً للفيديو، بل مجموعة من التعليمات لفيزياء المشهد. أي العناصر تبقى ثابتة، أيها يحصل على الحركة، كم يجب أن تكون ملحوظة، وهل يتطلب تأثير "التنفس" الدقيق أم سينماتوجرافيا كاملة مع ديناميات الكاميرا.

النتيجة النهائية — صورة علامة تجارية متحركة تم إنشاؤها بدون مصمم أو مصور فيديو في بضع ساعات من العمل مع أداتين. يمكن توسيع النهج: نفس المبادئ تعمل لمحتوى وسائل التواصل الاجتماعي واللافتات الإعلانية ومواد العرض وأي محتوى بصري يتطلب الامتثال لدليل العلامة التجارية. منهجية تحليل الطلب قابلة للتكرار لأي مشروع وأي هوية وأي أداة توليد.

لا يتغير المبدأ — تتغير فقط التفاصيل المحددة. لمن يرغب في تطبيق هذه الطريقة: ابدأ بوصف مفصل للغاية للمرجع الأصلي. قسّمه إلى 5–7 خصائص منفصلة.

اكتب الطلب ليس كجملة واحدة طويلة، بل كقائمة معاملات منظمة. تحقق من كل طبقة بشكل منفصل قبل تجميع الطلب النهائي. إن هذا التسلسل الدقيق — وليس سحر أداة معينة — هو ما يعطي نتائج متوقعة عند العمل مع أي ذكاء اصطناعي توليدي.

ZK
Hamidun News
أخبار الذكاء الاصطناعي بدون ضوضاء. اختيار تحريري يومي من أكثر من 400 مصدر. منتج من جمال حميدون، رئيس الذكاء الاصطناعي في Alpina Digital.

هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟

AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.

ما رأيك؟
جارٍ تحميل التعليقات…