Decomposição de prompts no Gemini e no Kling: como recriar um visual do Pinterest no estilo da marca
A decomposição do prompt é o principal segredo para a geração precisa de imagens. Em vez de um único prompt longo, é preciso dividir a referência em…
Processado por IA de Habr AI; editado por Hamidun News
Se o resultado da geração parece "quase bom, mas não é bem isso" — na maioria das vezes não é um problema da ferramenta, mas de como o prompt foi formulado. Uma autora da comunidade de IA russa compartilhou um método concreto que funciona: decompor um prompt em camadas semânticas separadas permite alcançar resultados precisos na primeira ou segunda tentativa — em vez de dezenas de iterações cegas. As ferramentas no exemplo são Gemini para geração de imagens e Kling para animação.
O ponto de partida foi uma imagem do Pinterest. A tarefa era não trivial: não copiar a imagem, mas adaptá-la ao estilo de marca da empresa — preservando o clima e a composição geral enquanto substituía completamente as cores, detalhes e estética de acordo com o guia de marca. É aqui que a decomposição começa.
Em vez de um único prompt longo, a autora dividiu a imagem original em componentes separados: cena geral e atmosfera, paleta de cores, iluminação, texturas, estilo de renderização, detalhes do primeiro e segundo plano. Cada elemento foi descrito separadamente — sequencialmente, camada por camada, com refinamento gradual dos detalhes. O Gemini funcionou como ferramenta de geração.
O princípio-chave do trabalho é não "carregar tudo em um prompt e torcer", mas diálogo estruturado com refinamento sequencial de cada elemento. Primeiro, define-se a cena geral. Depois, refina-se o estilo.
Em seguida, adicionam-se especificidades da marca: cores do guia, elementos característicos da identidade, soluções visuais permitidas e não permitidas. Essa abordagem reduz drasticamente o número de iterações: o modelo recebe instruções claras em vez de tentar adivinhar a intenção de uma descrição vaga. Modelos multimodais respondem melhor a descritores concretos do que a definições abstratas.
"Pôr do sol quente" produz resultados imprevisíveis. "Iluminação dourado-laranja em ângulo de 45 graus, sombras longas e suaves" — funciona de forma previsível. "Azul corporativo no espírito da marca" — instrução pouco clara.
"RGB 0, 82, 204, superfície brilhante, sem gradientes" — já é específico. A decomposição de prompt é traduzir uma imagem visual em uma linguagem que o modelo compreenda inequivocamente. Depois que a imagem foi montada para corresponder à identidade necessária, entrou em ação o Kling — uma ferramenta para animar imagens estáticas baseada em modelos generativos de vídeo.
Aqui a decomposição também funciona: o prompt especifica separadamente o que deve se mover, em que velocidade, em que direção e com que intensidade. Um prompt de animação não é uma descrição de vídeo, mas um conjunto de instruções para a física da cena. Quais elementos permanecem estáticos, quais recebem movimento, quão perceptível deve ser, e se um sutil efeito de "respiração" ou cinematografia completa com dinâmica de câmera é necessária.
O resultado final — uma imagem de marca animada criada sem designer ou videógrafo em algumas horas de trabalho com duas ferramentas. A abordagem é escalável: os mesmos princípios funcionam para conteúdo de redes sociais, banners publicitários, materiais de apresentação e qualquer visual que exija conformidade com guia de marca. A metodologia de decomposição de prompt é reproduzível para qualquer projeto, qualquer identidade e qualquer ferramenta generativa.
O princípio não muda — apenas os detalhes específicos mudam. Para quem quer aplicar este método: comece com uma descrição maximamente detalhada do referencial original. Divida-o em 5–7 características separadas.
Escreva o prompt não como uma frase longa, mas como uma lista de parâmetros estruturada. Verifique cada camada separadamente antes de montar o pedido final. É essa sequência exata — não mágica de uma ferramenta específica — que produz resultados previsíveis ao trabalhar com qualquer IA generativa.
Quer parar de ler sobre IA e começar a usar?
AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.