Habr AI→ original

Cómo un autor de Habr cambió los prompts por imágenes de referencia en ChatGPT y creó una serie de ilustraciones de AI

En Habr analizaron una técnica práctica para generar imágenes: en lugar de descripciones largas, el autor empezó a cargar en el modelo tres imágenes de…

Procesado por IA desde Habr AI; editado por Hamidun News
Cómo un autor de Habr cambió los prompts por imágenes de referencia en ChatGPT y creó una serie de ilustraciones de AI
Fuente: Habr AI. Collage: Hamidun News.
◐ Escuchar artículo

En Habr se publicó un estudio de caso detallado sobre cómo un experimento de diseño con estampados de hockey se convirtió en un esquema funcional para la generación de imágenes con IA. La idea principal es simple: en lugar de refinar infinitamente un prompt de texto, el autor comenzó a mostrar al modelo exactamente qué necesitaba dibujarse.

Cómo cambió el proceso

Inicialmente, el proyecto se concibió como una serie de camisetas con imágenes épicas de famosos jugadores de hockey. Se basó en arquetipos como "Alexander Ovechkin — El Arcángel" y "Evgeny Malkin — El Maestro de la Tormenta", y el conjunto final incluyó seis jugadores: Ovechkin, Panarin, Bobrovsky, Datsyuk, Sergachyov y Malkin. Durante el trabajo, el autor abandonó algunos atletas extranjeros: por un lado, querían hacer la colección más comprensible para la audiencia rusa, por otro lado, no todos los personajes se adaptaban igualmente bien a la generación en el estilo requerido.

Antes de esto, el flujo de trabajo parecía familiar para cualquiera que trabaje con gráficos generativos: primero, una explicación detallada de la tarea a ChatGPT, luego escribir un prompt para un modelo específico, después generación, aumento de escala, corrección de color y limpieza manual en Photoshop. Para aumentar la resolución, el autor utilizó primero AI Photo & Art Enhancer, luego pasó a Topaz; para estilización — Luminar AI. Pero el enfoque con control puramente textual tenía un techo: incluso un prompt muy detallado no garantizaba la pose exacta del personaje, elementos específicos del uniforme, números, insignias y otros detalles críticos para la mercancía.

Por qué funcionaron las referencias

El punto de inflexión fue la transición al prompting multimodal. En lugar de una instrucción de texto, el autor comenzó a armar una solicitud a partir de tres tipos de datos de entrada: imágenes del héroe mismo, fotografías de ropa o equipo, y una referencia separada para el ambiente y el estado de ánimo de la escena. En otras palabras, el modelo recibía no solo una descripción de la trama, sino también restricciones visuales que anteriormente había que intentar "escribir en palabras". Esto redujo drásticamente el número de desviaciones aleatorias en pose, forma, simbología y composición.

  • Foto del personaje central
  • Referencia de uniforme, ropa o equipo
  • Una imagen separada con la escena y atmósfera necesarias
  • Un brief en texto con el arquetipo, acción y detalles de composición

Para las pruebas, el autor cambió a arena.ai, donde puede ejecutar varios modelos de imagen fuertes de forma gratuita y comparar resultados en modo Lado a Lado. El caso de estudio menciona específicamente gemini-3-pro-image-preview-2k, también llamada nano-banana-pro, y gpt-image-1.5-high-fidelity. Según el autor, estas proporcionaron los resultados más convincentes con un posprocesamiento mínimo. Un beneficio adicional fueron pausas relativamente cortas después de alcanzar límites gratuitos — alrededor de 30-40 minutos, lo que para trabajo iterativo es notablemente más conveniente que muchas alternativas.

Usando el ejemplo de una imagen de Evgeni Malkin — The Stormbringer, el autor mostró cómo funciona el nuevo enfoque en la práctica. En el prompt, se pidió al modelo que combinara tres referencias cargadas y transformara a Malkin en un amo mitológico de una tormenta de hielo: con cielo tormentoso sobre la arena, grietas en el hielo, un bastón como conductor de rayo, y un disco parecido a un rayo esférico. Tal solicitud ya no intenta describir todo desde cero — establece un marco y permite al modelo ensamblar con mayor precisión la imagen necesaria a partir de ejemplos visuales mostrados previamente.

En qué se convirtió el proyecto

Como resultado, el experimento evolucionó a una colección completa THE HOCKEY GODS SERIES. Para cada jugador, el autor ideó una imagen separada: Pavel Datsyuk se convirtió en The Hockey Magician, Sergei Bobrovsky — The Man-Fortress, Alexander Ovechkin — The Archangel, Mikhail Sergachyov — The Ice Warden, Artemiy Panarin — The Trickster, y Evgeny Malkin — The Stormbringer. El logo de la serie se creó con la ayuda de ChatGPT, luego se convirtió de ráster a vector a través de Adobe Illustrator para que pudiera escalarse sin pérdida de calidad.

Inicialmente, el proyecto se consideraba comercial: el autor pensaba en vender la colección a través de plataformas de impresión de mercancía. Pero el cálculo resultó no ser muy inspirador — márgenes bajos, burocracia con registro y moderación manual de diseños hacían la empresa operacionalmente pesada. En algún momento, el proyecto cambió su objetivo: en lugar de intentar monetizar, el autor decidió lanzar los materiales al dominio público, incluyendo archivos de maqueta original en Adobe InDesign, versiones grandes en JPEG y un logo en varios formatos.

"A veces es mucho más interesante no vender una idea, sino dejarla

navegar libremente."

Lo que significa esto

El caso demuestra bien hacia dónde se desplaza el trabajo práctico con gráficos de IA en 2026. Los ganadores no son los prompts más largos, sino una combinación de texto, referencias y comparación rápida de modelos en una sola tarea. Para diseñadores, equipos editoriales y creadores de mercancía, esta es una señal importante: los modelos de imagen modernos ya se pueden usar no solo para la exploración del estado de ánimo, sino como una herramienta de producción controlada si monta correctamente el contexto visual en la entrada.

ZK
Hamidun News
Noticias de AI sin ruido. Selección editorial diaria de más de 400 fuentes. Producto de Zhemal Khamidun, Head of AI en Alpina Digital.

¿Quieres dejar de leer sobre IA y empezar a usarla?

AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.

¿Qué te parece?
Cargando comentarios…