Habr AI→ original

Decomposição de prompts no Gemini e no Kling: como recriar um visual do Pinterest no estilo da marca

A decomposição do prompt é o principal segredo para a geração precisa de imagens. Em vez de um único prompt longo, é preciso dividir a referência em…

Processado por IA de Habr AI; editado por Hamidun News
Decomposição de prompts no Gemini e no Kling: como recriar um visual do Pinterest no estilo da marca
Fonte: Habr AI. Colagem: Hamidun News.
◐ Ouvir artigo

Se o resultado da geração parece "quase bom, mas não é bem isso" — na maioria das vezes não é um problema da ferramenta, mas de como o prompt foi formulado. Uma autora da comunidade de IA russa compartilhou um método concreto que funciona: decompor um prompt em camadas semânticas separadas permite alcançar resultados precisos na primeira ou segunda tentativa — em vez de dezenas de iterações cegas. As ferramentas no exemplo são Gemini para geração de imagens e Kling para animação.

O ponto de partida foi uma imagem do Pinterest. A tarefa era não trivial: não copiar a imagem, mas adaptá-la ao estilo de marca da empresa — preservando o clima e a composição geral enquanto substituía completamente as cores, detalhes e estética de acordo com o guia de marca. É aqui que a decomposição começa.

Em vez de um único prompt longo, a autora dividiu a imagem original em componentes separados: cena geral e atmosfera, paleta de cores, iluminação, texturas, estilo de renderização, detalhes do primeiro e segundo plano. Cada elemento foi descrito separadamente — sequencialmente, camada por camada, com refinamento gradual dos detalhes. O Gemini funcionou como ferramenta de geração.

O princípio-chave do trabalho é não "carregar tudo em um prompt e torcer", mas diálogo estruturado com refinamento sequencial de cada elemento. Primeiro, define-se a cena geral. Depois, refina-se o estilo.

Em seguida, adicionam-se especificidades da marca: cores do guia, elementos característicos da identidade, soluções visuais permitidas e não permitidas. Essa abordagem reduz drasticamente o número de iterações: o modelo recebe instruções claras em vez de tentar adivinhar a intenção de uma descrição vaga. Modelos multimodais respondem melhor a descritores concretos do que a definições abstratas.

"Pôr do sol quente" produz resultados imprevisíveis. "Iluminação dourado-laranja em ângulo de 45 graus, sombras longas e suaves" — funciona de forma previsível. "Azul corporativo no espírito da marca" — instrução pouco clara.

"RGB 0, 82, 204, superfície brilhante, sem gradientes" — já é específico. A decomposição de prompt é traduzir uma imagem visual em uma linguagem que o modelo compreenda inequivocamente. Depois que a imagem foi montada para corresponder à identidade necessária, entrou em ação o Kling — uma ferramenta para animar imagens estáticas baseada em modelos generativos de vídeo.

Aqui a decomposição também funciona: o prompt especifica separadamente o que deve se mover, em que velocidade, em que direção e com que intensidade. Um prompt de animação não é uma descrição de vídeo, mas um conjunto de instruções para a física da cena. Quais elementos permanecem estáticos, quais recebem movimento, quão perceptível deve ser, e se um sutil efeito de "respiração" ou cinematografia completa com dinâmica de câmera é necessária.

O resultado final — uma imagem de marca animada criada sem designer ou videógrafo em algumas horas de trabalho com duas ferramentas. A abordagem é escalável: os mesmos princípios funcionam para conteúdo de redes sociais, banners publicitários, materiais de apresentação e qualquer visual que exija conformidade com guia de marca. A metodologia de decomposição de prompt é reproduzível para qualquer projeto, qualquer identidade e qualquer ferramenta generativa.

O princípio não muda — apenas os detalhes específicos mudam. Para quem quer aplicar este método: comece com uma descrição maximamente detalhada do referencial original. Divida-o em 5–7 características separadas.

Escreva o prompt não como uma frase longa, mas como uma lista de parâmetros estruturada. Verifique cada camada separadamente antes de montar o pedido final. É essa sequência exata — não mágica de uma ferramenta específica — que produz resultados previsíveis ao trabalhar com qualquer IA generativa.

ZK
Hamidun News
Notícias de AI sem ruído. Seleção editorial diária de mais de 400 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.

Quer parar de ler sobre IA e começar a usar?

AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.

O que você acha?
Carregando comentários…