VK a montré comment l’éditeur photo AI « Otredach » est passé de la blague à la victoire au Dev Grants 2025
VK a raconté l’histoire de la mini-application « Otredach », qui est passée d’un projet personnel lancé pour plaisanter à un éditeur photo AI opérationnel…
Traité par IA depuis Habr AI ; édité par Hamidun News
VK a publié une étude de cas du développeur Anton Lenev, qui a transformé un projet expérimental d'IA en la mini-app "Otredach" sur la plateforme VK Mini Apps. L'histoire s'est terminée non seulement par une victoire à VK Dev Grants 2025, mais aussi par un produit fonctionnel : au cours des six derniers mois, le service a été visité par plus de 109 000 utilisateurs uniques.
De l'Idée au Produit
L'histoire a commencé en 2023, non pas avec un éditeur de photos, mais avec un service humoristique de « divination » basé sur GPT-3.5. Lenev a créé une interface simple en Next.js, ajouté la génération de réponses en streaming et connecté l'application avec une imprimante Bluetooth pour enfants, pour que les prédictions puissent être imprimées immédiatement. Le format a décollé de manière inattendue : les vidéos le démontrant se sont propagées rapidement sur les réseaux sociaux, et les organisateurs d'événements se sont intéressés au service, appréciant ce mode d'interaction avec les réseaux de neurones.
La version suivante est apparue en 2024, lorsque les modèles ont commencé à fonctionner avec confiance avec des images en entrée. Le développeur a alors assemblé un nouveau prototype : l'utilisateur chargeait une photo de marc de café ou de feuilles de thé, et le modèle interprétait l'image et produisait une « prédiction » textuelle. L'expérience a à nouveau réssonné avec le public, le projet a été intégré avec VK Bridge, la monétisation publicitaire a été conservée, et au final ils ont remporté VK Fresh Code 2024 avec, ce qui est devenu le premier signal sérieux concernant la viabilité de l'idée.
En 2025, Lenev s'est délibérément éloigné du format de pur divertissement. Au lieu d'un autre projet personnel, il a décidé d'assembler un produit complet avec une économie plus claire et un cas d'usage de masse. Face à l'émergence de Nano Banana, OpenAI GPT Image 1.5 et Seedream 4.5, le développeur a choisi un cas simple mais clair : l'utilisateur charge une photo et reçoit une version stylisée de l'image — d'un portrait médiéval à une carte postale rétro ou une séance photo de fin d'année.
Comment Fonctionne le Service
Techniquement, "Otredach" est construit sans complexité inutile. Le frontend utilise un SPA standard avec priorité UX mobile-first, intégration via VK Bridge et un VK UI Kit adapté. Entre l'interface et les fournisseurs de modèles se trouve une couche BFF : elle vérifie les signatures VK, valide les données d'entrée, envoie les requêtes aux API de modèles, accepte les webhooks à la fin et gère la logique métier autour des générations afin que le scénario utilisateur ne s'effondre pas sur les erreurs des services externes.
Au lieu d'une infrastructure lourde avec PostgreSQL, répliques et Kubernetes, le développeur a choisi PocketBase sur Go au-dessus de SQLite. Pour une charge modérée, cela s'est avéré suffisant : la solution fournissait un tableau de bord d'administration intégré, des migrations, des hooks pour la logique et une consommation très faible de ressources. Cette pile reflète bien l'approche produit de Lenev : d'abord vérifier rapidement la demande et l'économie unitaire, plutôt que de passer des mois à adapter un système qui n'a pas encore prouvé que quelqu'un en a réellement besoin.
L'approche des modèles est particulièrement intéressante. Lenev a refusé d'entraîner ses propres modèles et le fine-tuning, car pour un projet indépendant c'est trop cher et lourd organisationnellement. Au lieu de cela, "Otredach" fonctionne via des agrégateurs d'API comme Replicate et sélectionne un modèle pour un gabarit visuel spécifique, et non pour une idée abstraite de « meilleure qualité à tout prix ». Cette approche aide à maintenir simultanément la qualité, la vitesse de réponse et le coût de génération sous contrôle.
- Les scénarios visuels complexes utilisent des modèles plus puissants et coûteux
- Les gabarits de masse connectent des configurations moins chères avec une qualité acceptable
- Pour chaque style, un prompt séparé est écrit avec des limitations strictes sur la composition et la reconnaissance faciale
- Le service retourne automatiquement des points si la génération a échoué ou s'est figée avec le fournisseur
- Les requêtes répétées et les charges inutiles sont limitées par les limites de débit et la protection contre les doublons
«
La direction choisie n'est pas seulement techniquement intéressante, mais aussi significative du point de vue du produit », écrit Lenev.
Économie et Subvention
La partie principale de cette étude de cas n'est pas la génération d'images en elle-même, mais le contrôle des dépenses. Lenev écrit qu'il était déjà clair à un stade précoce : sans économie stricte, un tel produit brûlerait rapidement le budget. Rien qu'en octobre 2025, les coûts de génération ont dépassé 500 $, de sorte que l'application a été immédiatement conçue pour au moins ne pas aller dans le rouge. Pour l'auteur, il ne s'agit pas de dépenses abstraites en nuage, mais de l'argent réel qui doit être récupéré par le biais d'un modèle de monétisation fonctionnant au sein de VK.
Pour maintenir le projet à flot, le développeur n'a pas poursuivi les modèles les plus chers dans chaque scénario, mais a sélectionné un équilibre entre le prix et les résultats. Les prompts ont été optimisés pour des configurations moins chères, et certaines limitations ont été introduites non pas pour la beauté de l'interface, mais pour la survie économique : limites de génération, protection contre les doublons, retour de la monnaie intérieure en cas d'échec et contrôle de la fréquence des requêtes.
En conséquence, selon l'auteur, l'application s'équilibre avec un petit bénéfice par rapport aux coûts de génération, à l'infrastructure et aux paiements obligatoires. Dans la première étape de VK Dev Grants 2025, Lenev a présenté une idée pour une application différente — "Live Photos", qui anime les images. Ensuite, sur une architecture similaire, "Otredach" est apparu, et les deux produits ont commencé à se compléter : d'abord l'utilisateur crée une image, puis la transforme en courte vidéo.
À la fin de la compétition, ce n'était plus un concept sur des diapositives, mais un service en direct avec des utilisateurs, une infrastructure fonctionnelle, une économie fonctionnelle et un cas d'usage clair, ce qui a finalement apporté la victoire au programme de subventions.
Ce Que Cela Signifie
L'étude de cas "Otredach" montre que dans les produits d'IA, ce n'est pas la pile la plus complexe et ce n'est pas un modèle propriétaire qui gagne, mais une hypothèse rapidement validée, une monétisation compréhensible et un empaquetage précis du scénario pour une plateforme de masse. Pour les développeurs indépendants, c'est un signal important : le chemin d'une expérience ironique à un produit avec une audience à six chiffres et une subvention VK est toujours possible si le projet a de la demande, de la discipline dans les dépenses et assez de patience pour faire passer l'idée à un service fonctionnel.
Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?
AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.