Habr AI→ оригинал

Prompt decomposition in Gemini and Kling: how to recreate a Pinterest visual in a brand style

Prompt decomposition is the main secret to precise image generation. Instead of one long prompt, you need to break the reference into components — mood, color p

Prompt decomposition in Gemini and Kling: how to recreate a Pinterest visual in a brand style
Источник: Habr AI. Коллаж: Hamidun News.

Если результат генерации выглядит «почти хорошо, но не то» — чаще всего дело не в инструменте, а в том, как сформулирован запрос. Автор из русскоязычного ИИ-сообщества поделилась конкретным рабочим методом: декомпозиция промпта на отдельные смысловые слои позволяет добиться точного попадания с первой или второй попытки — вместо десятков итераций вслепую. Инструменты в примере — Gemini для генерации изображений и Kling для анимации.

Отправной точкой стало изображение из Pinterest. Задача была нетривиальной: не скопировать его, а адаптировать под фирменный стиль компании — сохранить настроение и общую композицию, полностью заменив при этом цвета, детали и эстетику под брендбук. Именно здесь начинается декомпозиция.

Вместо одного длинного промпта автор разложила исходное изображение на отдельные компоненты: общая сцена и атмосфера, цветовая палитра, освещение, текстуры, стиль отрисовки, детали переднего и заднего плана. Каждый элемент описывался отдельно — последовательно, слой за слоем, с постепенным уточнением деталей. В роли инструмента для генерации выступал Gemini.

Ключевой принцип работы — не «загрузи всё в один промпт и надейся», а структурированный диалог с последовательным уточнением каждого элемента. Сначала задаётся общая сцена. Потом уточняется стиль.

Затем добавляется специфика бренда: цвета из гайдлайна, характерные элементы айдентики, допустимые и недопустимые визуальные решения. Такой подход резко сокращает количество итераций: модель получает чёткие инструкции, а не пытается угадать намерение из туманного описания. Мультимодальные модели лучше реагируют на конкретные дескрипторы, чем на абстрактные определения.

«Тёплый закат» даёт непредсказуемый результат. «Золотисто-оранжевое освещение под углом 45 градусов, длинные мягкие тени» — работает предсказуемо. «Корпоративный синий в духе бренда» — неясная инструкция.

«RGB 0, 82, 204, глянцевая поверхность, без градиентов» — уже конкретика. Декомпозиция промпта — это перевод визуального образа на язык, который модель понимает однозначно. После того как изображение было собрано под нужную айдентику, в работу вошёл Kling — инструмент для анимации статичных изображений на базе видеогенеративных моделей.

Здесь декомпозиция тоже работает: в промпте отдельно указывается, что должно двигаться, с какой скоростью, в каком направлении и с какой интенсивностью. Промпт для анимации — это не описание видео, а набор инструкций для физики сцены. Какие элементы остаются статичными, какие получают движение, насколько оно должно быть заметным и нужен ли тонкий эффект «дыхания» или полноценная кинематика с динамикой камеры.

Итоговый результат — анимированное брендовое изображение, созданное без дизайнера и видеографа за несколько часов работы с двумя инструментами. Подход масштабируется: те же принципы работают для social media-контента, рекламных баннеров, презентационных материалов и любого визуала, требующего соответствия брендбуку. Методика декомпозиции промптов воспроизводима для любого проекта, любой айдентики и любого генеративного инструмента.

Принцип не меняется — меняются только конкретные детали. Для тех, кто хочет применить этот метод: начните с максимально подробного описания исходного референса. Разбейте его на 5–7 отдельных характеристик.

Пишите промпт не как одно длинное предложение, а как структурированный список параметров. Проверяйте каждый слой отдельно, прежде чем собирать финальный запрос. Именно такая последовательность — а не магия конкретного инструмента — даёт предсказуемый результат при работе с любым генеративным ИИ.

ЖХ
Hamidun News
AI‑новости без шума. Ежедневный редакторский отбор из 400+ источников. Продукт Жемала Хамидуна, Head of AI в Alpina Digital.
Загружаем комментарии…