Comment un auteur de Habr a remplacé les prompts par des images de référence dans ChatGPT et créé une série d'illustrations AI
Habr détaille une méthode pratique de génération d'images : au lieu de longues descriptions, l'auteur a commencé à charger dans le modèle trois images de référe
На Habr вышел подробный кейс о том, как дизайнерский эксперимент с хоккейными принтами превратился в рабочую схему для AI-генерации изображений. Главная идея проста: вместо того чтобы бесконечно уточнять текстовый промпт, автор начал показывать модели, что именно ей нужно нарисовать.
Как изменился процесс
Изначально проект задумывался как серия футболок с эпичными образами известных хоккеистов. В основу легли архетипы вроде «Александр Овечкин — Архангел» и «Евгений Малкин — Повелитель бури», а в финальный набор вошли шесть игроков: Овечкин, Панарин, Бобровский, Дацюк, Сергачёв и Малкин. По ходу работы автор отказался от части иностранных спортсменов: с одной стороны, хотелось сделать коллекцию понятнее для российской аудитории, с другой — не все персонажи одинаково хорошо поддавались генерации в нужной стилистике.
До этого workflow выглядел знакомо всем, кто работает с генеративной графикой: сначала подробное объяснение задачи ChatGPT, затем написание промпта под конкретную модель, после — генерация, апскейл, цветокоррекция и ручная чистка в Photoshop. Для повышения разрешения автор сначала использовал AI Photo & Art Enhancer, а затем перешёл на Topaz; для стилизации — Luminar AI. Но у подхода с чисто текстовым управлением был потолок: даже очень подробный промпт не гарантировал точную позу персонажа, конкретные элементы формы, номера, знаки отличия и другие детали, критичные для мерча.
Почему референсы сработали Переломным моментом стал переход к мультимодальному промптингу.
Вместо одной текстовой инструкции автор начал собирать запрос из трёх типов входных данных: изображения самого героя, фотографии одежды или экипировки и отдельного референса для окружения и настроения сцены. Иными словами, модель получала не только описание сюжета, но и визуальные ограничения, которые раньше приходилось пытаться «выписать словами». Это резко снизило число случайных отклонений в позе, форме, символике и композиции.
- Фото центрального персонажа Референс формы, одежды или экипировки Отдельную картинку с нужной сценой и атмосферой * Текстовый бриф с архетипом, действием и деталями композиции Для тестов автор перешёл на arena.ai, где можно бесплатно запускать несколько сильных image-моделей и сравнивать результат в режиме Side by Side. В кейсе отдельно упоминаются gemini-3-pro-image-preview-2k, также называемая nano-banana-pro, и gpt-image-1.5-high-fidelity. По словам автора, именно они дали наиболее убедительные результаты с минимальной постобработкой. Дополнительным плюсом стали сравнительно короткие паузы после достижения бесплатных лимитов — около 30–40 минут, что для итеративной работы заметно удобнее многих альтернатив. На примере изображения Evgeni Malkin — The Stormbringer автор показал, как работает новый подход на практике. В промпте модель просили совместить три загруженных референса и превратить Малкина в мифологического повелителя ледяной бури: со штормовым небом над ареной, трещинами на льду, клюшкой как проводником молнии и шайбой, похожей на шаровую молнию. Такой запрос уже не пытается описать всё с нуля — он задаёт рамку и позволяет модели точнее собрать нужный образ из заранее показанных визуальных примеров.
Во что вырос проект В результате эксперимент оформился в полноценную
коллекцию THE HOCKEY GODS SERIES. Для каждого игрока автор придумал отдельный образ: Павел Дацюк стал The Hockey Magician, Сергей Бобровский — The Man-Fortress, Александр Овечкин — The Archangel, Михаил Сергачёв — The Ice Warden, Артемий Панарин — The Trickster, а Евгений Малкин — The Stormbringer. Логотип серии сделали при участии ChatGPT, после чего перевели из растра в вектор через Adobe Illustrator, чтобы его можно было масштабировать без потери качества.
Изначально проект рассматривался как коммерческий: автор думал о продаже коллекции через платформы печати мерча. Но расчёт оказался не слишком вдохновляющим — низкая маржа, бюрократия с оформлением и ручная модерация дизайнов делали затею тяжёлой в операционном смысле. В какой-то момент проект сменил цель: вместо попытки монетизации автор решил выложить материалы в открытый доступ, включая исходники макетов в Adobe InDesign, большие JPEG-версии и логотип в нескольких форматах.
«Иногда гораздо интереснее не продавать идею, а отпустить её в
свободное плавание».
Что это значит Кейс хорошо показывает, куда смещается практическая работа с AI-графикой в 2026 году.
Побеждают не самые длинные промпты, а комбинация текста, референсов и быстрого сравнения моделей на одной задаче. Для дизайнеров, редакций и создателей мерча это важный сигнал: современные image-модели уже можно использовать не только для поиска настроения, но и как инструмент управляемого продакшена, если правильно собрать визуальный контекст на входе.