Prompt decomposition in Gemini and Kling: how to recreate a Pinterest visual in a brand style
Prompt decomposition is the main secret to precise image generation. Instead of one long prompt, you need to break the reference into components — mood, color p

Если результат генерации выглядит «почти хорошо, но не то» — чаще всего дело не в инструменте, а в том, как сформулирован запрос. Автор из русскоязычного ИИ-сообщества поделилась конкретным рабочим методом: декомпозиция промпта на отдельные смысловые слои позволяет добиться точного попадания с первой или второй попытки — вместо десятков итераций вслепую. Инструменты в примере — Gemini для генерации изображений и Kling для анимации.
Отправной точкой стало изображение из Pinterest. Задача была нетривиальной: не скопировать его, а адаптировать под фирменный стиль компании — сохранить настроение и общую композицию, полностью заменив при этом цвета, детали и эстетику под брендбук. Именно здесь начинается декомпозиция.
Вместо одного длинного промпта автор разложила исходное изображение на отдельные компоненты: общая сцена и атмосфера, цветовая палитра, освещение, текстуры, стиль отрисовки, детали переднего и заднего плана. Каждый элемент описывался отдельно — последовательно, слой за слоем, с постепенным уточнением деталей. В роли инструмента для генерации выступал Gemini.
Ключевой принцип работы — не «загрузи всё в один промпт и надейся», а структурированный диалог с последовательным уточнением каждого элемента. Сначала задаётся общая сцена. Потом уточняется стиль.
Затем добавляется специфика бренда: цвета из гайдлайна, характерные элементы айдентики, допустимые и недопустимые визуальные решения. Такой подход резко сокращает количество итераций: модель получает чёткие инструкции, а не пытается угадать намерение из туманного описания. Мультимодальные модели лучше реагируют на конкретные дескрипторы, чем на абстрактные определения.
«Тёплый закат» даёт непредсказуемый результат. «Золотисто-оранжевое освещение под углом 45 градусов, длинные мягкие тени» — работает предсказуемо. «Корпоративный синий в духе бренда» — неясная инструкция.
«RGB 0, 82, 204, глянцевая поверхность, без градиентов» — уже конкретика. Декомпозиция промпта — это перевод визуального образа на язык, который модель понимает однозначно. После того как изображение было собрано под нужную айдентику, в работу вошёл Kling — инструмент для анимации статичных изображений на базе видеогенеративных моделей.
Здесь декомпозиция тоже работает: в промпте отдельно указывается, что должно двигаться, с какой скоростью, в каком направлении и с какой интенсивностью. Промпт для анимации — это не описание видео, а набор инструкций для физики сцены. Какие элементы остаются статичными, какие получают движение, насколько оно должно быть заметным и нужен ли тонкий эффект «дыхания» или полноценная кинематика с динамикой камеры.
Итоговый результат — анимированное брендовое изображение, созданное без дизайнера и видеографа за несколько часов работы с двумя инструментами. Подход масштабируется: те же принципы работают для social media-контента, рекламных баннеров, презентационных материалов и любого визуала, требующего соответствия брендбуку. Методика декомпозиции промптов воспроизводима для любого проекта, любой айдентики и любого генеративного инструмента.
Принцип не меняется — меняются только конкретные детали. Для тех, кто хочет применить этот метод: начните с максимально подробного описания исходного референса. Разбейте его на 5–7 отдельных характеристик.
Пишите промпт не как одно длинное предложение, а как структурированный список параметров. Проверяйте каждый слой отдельно, прежде чем собирать финальный запрос. Именно такая последовательность — а не магия конкретного инструмента — даёт предсказуемый результат при работе с любым генеративным ИИ.