Como um autor do Habr trocou prompts por imagens de referência no ChatGPT e criou uma série de gravuras de AI
No Habr, detalharam uma técnica prática de geração de imagens: em vez de descrições longas, o autor passou a enviar ao modelo três imagens de referência — o…
Processado por IA de Habr AI; editado por Hamidun News
No Habr foi publicado um estudo de caso detalhado sobre como um experimento de design com estampas de hóquei se transformou em um esquema funcional para geração de imagens com IA. A ideia principal é simples: em vez de refinar infinitamente um prompt de texto, o autor começou a mostrar ao modelo exatamente o que precisava ser desenhado.
Como o processo mudou
Inicialmente, o projeto foi concebido como uma série de camisetas com imagens épicas de famosos jogadores de hóquei. Foi baseado em arquétipos como "Alexander Ovechkin — O Arcanjo" e "Evgeny Malkin — O Mestre da Tempestade", e o conjunto final incluiu seis jogadores: Ovechkin, Panarin, Bobrovsky, Datsyuk, Sergachyov e Malkin. Durante o trabalho, o autor abandonou alguns atletas estrangeiros: por um lado, queriam tornar a coleção mais compreensível para o público russo, por outro lado, nem todos os personagens se adaptavam igualmente bem à geração no estilo necessário.
Antes disso, o fluxo de trabalho parecia familiar para qualquer um que trabalha com gráficos generativos: primeiro, uma explicação detalhada da tarefa para o ChatGPT, depois escrever um prompt para um modelo específico, depois geração, aumento de resolução, correção de cores e limpeza manual no Photoshop. Para aumentar a resolução, o autor usou primeiro AI Photo & Art Enhancer, depois mudou para Topaz; para estilização — Luminar AI. Mas a abordagem com controle puramente textual tinha um teto: mesmo um prompt muito detalhado não garantia a pose exata do personagem, elementos específicos do uniforme, números, insígnias e outros detalhes críticos para a mercadoria.
Por que as referências funcionaram
O ponto de inflexão foi a transição para prompting multimodal. Em vez de uma instrução de texto, o autor começou a montar uma solicitação a partir de três tipos de dados de entrada: imagens do herói em si, fotografias de roupas ou equipamentos, e uma referência separada para o ambiente e o clima da cena. Em outras palavras, o modelo recebeu não apenas uma descrição do enredo, mas também restrições visuais que anteriormente precisavam ser tentadas "escrever em palavras". Isso reduziu drasticamente o número de desvios aleatórios em pose, forma, simbologia e composição.
- Foto do personagem central
- Referência de uniforme, roupa ou equipamento
- Uma imagem separada com a cena e atmosfera necessárias
- Um briefing em texto com o arquétipo, ação e detalhes de composição
Para testes, o autor mudou para arena.ai, onde você pode executar vários modelos de imagem fortes gratuitamente e comparar resultados em modo Lado a Lado. O estudo de caso menciona separadamente gemini-3-pro-image-preview-2k, também chamada de nano-banana-pro, e gpt-image-1.5-high-fidelity. De acordo com o autor, essas proporcionaram os resultados mais convincentes com pós-processamento mínimo. Um bônus adicional foram pausas relativamente curtas após atingir limites gratuitos — cerca de 30-40 minutos, o que para trabalho iterativo é notavelmente mais conveniente do que muitas alternativas.
Usando o exemplo de uma imagem de Evgeni Malkin — The Stormbringer, o autor mostrou como a nova abordagem funciona na prática. No prompt, o modelo foi solicitado a combinar três referências carregadas e transformar Malkin em um mestre mitológico de uma tempestade de gelo: com céu tempestuoso sobre a arena, rachaduras no gelo, um taco como condutor de raios, e uma pele parecida com relâmpago em bola. Tal solicitação não tenta mais descrever tudo do zero — ela define um marco e permite ao modelo montar com mais precisão a imagem necessária a partir de exemplos visuais pré-mostrados.
No que o projeto se tornou
Como resultado, o experimento evoluiu para uma coleção completa THE HOCKEY GODS SERIES. Para cada jogador, o autor criou uma imagem separada: Pavel Datsyuk se tornou The Hockey Magician, Sergei Bobrovsky — The Man-Fortress, Alexander Ovechkin — The Archangel, Mikhail Sergachyov — The Ice Warden, Artemiy Panarin — The Trickster, e Evgeny Malkin — The Stormbringer. O logotipo da série foi criado com a ajuda do ChatGPT, depois convertido de raster para vetor através do Adobe Illustrator para que pudesse ser dimensionado sem perda de qualidade.
Inicialmente, o projeto era considerado comercial: o autor pensava em vender a coleção através de plataformas de impressão de mercadorias. Mas o cálculo não foi muito inspirador — margens baixas, burocracia com registro e moderação manual de designs tornaram o empreendimento operacionalmente pesado. Em algum momento, o projeto mudou seu objetivo: em vez de tentar monetizar, o autor decidiu liberar os materiais no domínio público, incluindo arquivos de layout original em Adobe InDesign, grandes versões em JPEG e um logotipo em vários formatos.
"Às vezes é muito mais interessante não vender uma ideia, mas deixá-la
flutuar livremente."
O que isso significa
O estudo de caso demonstra bem para onde o trabalho prático com gráficos de IA está se deslocando em 2026. Os vencedores não são os prompts mais longos, mas uma combinação de texto, referências e comparação rápida de modelos em uma única tarefa. Para designers, equipes editoriais e criadores de mercadorias, este é um sinal importante: modelos de imagem modernos já podem ser usados não apenas para exploração de humor, mas como uma ferramenta de produção controlada se você montar corretamente o contexto visual na entrada.
Quer parar de ler sobre IA e começar a usar?
AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.