Habr AI→ original

Comment un auteur de Habr a remplacé les prompts par des images de référence dans ChatGPT et créé une série d'illustrations AI

Habr détaille une méthode pratique de génération d'images : au lieu de longues descriptions, l'auteur a commencé à charger dans le modèle trois images de…

Traité par IA depuis Habr AI ; édité par Hamidun News
Comment un auteur de Habr a remplacé les prompts par des images de référence dans ChatGPT et créé une série d'illustrations AI
Source : Habr AI. Collage: Hamidun News.
◐ Écouter l'article

Sur Habr, une étude de cas détaillée a été publiée sur la façon dont une expérience de conception avec des estampes de hockey s'est transformée en un schéma fonctionnel pour la génération d'images par IA. L'idée principale est simple : au lieu d'affiner sans fin une instruction textuelle, l'auteur a commencé à montrer au modèle exactement ce qui devait être dessiné.

Comment le processus a changé

Au départ, le projet a été conçu comme une série de t-shirts avec des images épiques de célèbres joueurs de hockey. Il s'est basé sur des archétypes comme « Alexander Ovechkin — L'Archange » et « Evgeny Malkin — Le Maître de la Tempête », et l'ensemble final comprenait six joueurs : Ovechkin, Panarin, Bobrovsky, Datsyuk, Sergachyov et Malkin. Au cours du travail, l'auteur a abandonné certains athlètes étrangers : d'une part, il voulait rendre la collection plus compréhensible pour le public russe, d'autre part, tous les personnages ne se prêtaient pas aussi bien à la génération dans le style requis.

Avant cela, le flux de travail ressemblait à celui de toute personne travaillant avec des graphiques génératifs : d'abord, une explication détaillée de la tâche à ChatGPT, puis la rédaction d'une instruction pour un modèle spécifique, puis la génération, l'upscaling, la correction des couleurs et le nettoyage manuel dans Photoshop. Pour augmenter la résolution, l'auteur a d'abord utilisé AI Photo & Art Enhancer, puis est passé à Topaz ; pour la stylisation — Luminar AI. Mais l'approche basée uniquement sur le contrôle textuel avait une limite : même une instruction très détaillée ne garantissait pas la pose exacte du personnage, les éléments spécifiques de l'uniforme, les numéros, les insignes et autres détails essentiels pour la marchandise.

Pourquoi les références ont fonctionné

Le tournant a été la transition vers le prompting multimodal. Au lieu d'une seule instruction textuelle, l'auteur a commencé à assembler une demande à partir de trois types de données d'entrée : des images du héros lui-même, des photographies de vêtements ou d'équipement, et une référence distincte pour l'environnement et l'ambiance de la scène. En d'autres termes, le modèle recevait non seulement une description de l'intrigue, mais aussi des contraintes visuelles qui devaient auparavant être tentées « d'exprimer en paroles ». Cela a réduit de manière drastique le nombre de déviations aléatoires dans la pose, la forme, la symbolique et la composition.

  • Photo du personnage central
  • Référence de l'uniforme, des vêtements ou de l'équipement
  • Une image distincte avec la scène et l'atmosphère requises
  • Un brief textuel avec l'archétype, l'action et les détails de composition

Pour les tests, l'auteur est passé à arena.ai, où vous pouvez exécuter gratuitement plusieurs modèles d'image puissants et comparer les résultats en mode Côte à Côte. L'étude de cas mentionne spécifiquement gemini-3-pro-image-preview-2k, aussi appelée nano-banana-pro, et gpt-image-1.5-high-fidelity. Selon l'auteur, ce sont elles qui ont donné les résultats les plus convaincants avec un post-traitement minimal. Un avantage supplémentaire a été les pauses relativement courtes après avoir atteint les limites gratuites — environ 30-40 minutes, ce qui pour le travail itératif est notablement plus pratique que de nombreuses alternatives.

En utilisant l'exemple d'une image d'Evgeni Malkin — The Stormbringer, l'auteur a montré comment la nouvelle approche fonctionne en pratique. Dans l'instruction, on a demandé au modèle de combiner trois références téléchargées et de transformer Malkin en un maître mythologique d'une tempête de glace : avec un ciel orageux au-dessus de l'arène, des fissures dans la glace, un bâton comme conducteur d'éclair, et un disque ressemblant à un éclair en boule. Une telle demande ne tente plus de tout décrire à partir de zéro — elle établit un cadre et permet au modèle d'assembler plus précisément l'image nécessaire à partir d'exemples visuels préalablement montrés.

Ce que le projet est devenu

En conséquence, l'expérience a évolué en une collection complète THE HOCKEY GODS SERIES. Pour chaque joueur, l'auteur a imaginé une image distincte : Pavel Datsyuk est devenu The Hockey Magician, Sergei Bobrovsky — The Man-Fortress, Alexander Ovechkin — The Archangel, Mikhail Sergachyov — The Ice Warden, Artemiy Panarin — The Trickster, et Evgeny Malkin — The Stormbringer. Le logo de la série a été créé avec l'aide de ChatGPT, puis converti de format raster en vecteur via Adobe Illustrator pour pouvoir être dimensionné sans perte de qualité.

Initialement, le projet était considéré comme commercial : l'auteur pensait à vendre la collection par le biais de plateformes d'impression de marchandise. Mais le calcul s'avérait peu inspirant — des marges faibles, de la bureaucratie lors de l'enregistrement et une modération manuelle des designs rendaient l'entreprise opérationnellement lourde. À un moment donné, le projet a changé d'objectif : au lieu de tenter de monétiser, l'auteur a décidé de libérer les matériaux dans le domaine public, y compris les fichiers de mise en page originale dans Adobe InDesign, les grandes versions JPEG et le logo dans plusieurs formats.

«

Parfois, il est bien plus intéressant de ne pas vendre une idée, mais de la laisser flotter librement. »

Ce que cela signifie

L'étude de cas montre bien vers où se déplace le travail pratique avec les graphiques IA en 2026. Les gagnants ne sont pas les instructions les plus longues, mais une combinaison de texte, de références et de comparaison rapide des modèles sur une même tâche. Pour les designers, les rédactions et les créateurs de marchandise, c'est un signal important : les modèles d'image modernes peuvent déjà être utilisés non seulement pour l'exploration d'atmosphère, mais comme un outil de production contrôlée si vous assemblez correctement le contexte visuel en entrée.

ZK
Hamidun News
Actualités IA sans bruit. Sélection éditoriale quotidienne de plus de 400 sources. Produit de Zhemal Khamidun, Head of AI chez Alpina Digital.

Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?

AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.

Qu'en pensez-vous ?
Chargement des commentaires…