MarkTechPost→ original

Harry Tan a lancé gstack — un système de workflow pour Claude Code avec QA, revue et release

Harry Tan a ouvert le code source de gstack — une couche de workflow pour Claude Code qui divise le développement en modes distincts : planification, revue…

Traité par IA depuis MarkTechPost ; édité par Hamidun News
Harry Tan a lancé gstack — un système de workflow pour Claude Code avec QA, revue et release
Source : MarkTechPost. Collage: Hamidun News.
◐ Écouter l'article

Harry Tan a publié gstack en open source — un ensemble de skills pour Claude Code qui transforme le travail avec un agent IA pour le code en un processus plus rigoureux et prévisible. L'idée est simple : au lieu de mélanger la planification, l'examen d'ingénierie, l'assurance qualité et la sortie dans une unique invite infiniste, les séparer en modes distincts avec des rôles clairs.

Qu'est-ce que gstack

À la base, gstack n'est pas un nouveau modèle et pas un autre framework d'agents, mais une couche de workflow par-dessus Claude Code. Le projet empaquette les étapes typiques de livraison de logiciels en commandes séparées et attribue à chacune son propre mode de réflexion. Au lieu d'improvisation dans l'esprit « construisez une feature et révisez-la vous-même », le développeur reçoit une séquence d'étapes : d'abord une formulation de produit, puis un plan d'ingénierie, puis un examen, des tests dans le navigateur et uniquement après cela la préparation de la sortie. En d'autres termes, gstack essaie d'ajouter au développement avec IA non pas de la magie, mais de la discipline de processus.

« Eight opinionated workflow skills for Claude Code » — c'est ainsi que le projet se décrit.

L'idée clé ici n'est pas de donner à l'agent plus de liberté, mais plutôt l'inverse — restreindre le contexte de chaque tâche. Selon la description du projet, cela devrait réduire le nombre de solutions faibles qui apparaissent quand une seule IA invente simultanément une feature, écrit du code, teste l'interface et décide si cela peut être déployé en production. gstack sépare ces rôles et les force à être exécutés séquentiellement, comme si différentes personnes avec des zones de responsabilité différentes travaillaient sur la tâche.

Huit modes de fonctionnement

Au moment de la sortie, le référentiel contenait huit commandes principales, chacune responsable d'une partie séparée du processus, plutôt que « tout d'un coup ». C'est le pari principal de gstack : la qualité s'améliore non par une nouvelle intelligence, mais par la discipline autour de l'agent de code existant. Une commande séparée vérifie l'idée du produit, une autre vérifie l'architecture et les tests, une autre vérifie les risques dans le code, et une encore une autre est responsable de l'étape finale avant la fusion et la sortie.

  • `/plan-ceo-review` — examen de produit de l'idée et des priorités
  • `/plan-eng-review` — architecture, flux de données, cas limites et tests
  • `/review` — recherche de risques en production et problèmes de code
  • `/ship` — synchronisation de branche, exécutions de tests et préparation de PR
  • `/browse`, `/qa`, `/setup-browser-cookies`, `/retro` — navigateur, assurance qualité, importation de cookies et rétrospective

Cette division en rôles semble particulièrement logique face à un problème typique du coding avec IA : l'agent écrit rapidement le chemin heureux, mais omet souvent les cas limites, les régressions et les défaillances UX. Dans gstack, ces vérifications sont mises en modes séparés pour qu'elles ne rivalisent pas avec la tâche « écrire du code aussi vite que possible ». Cela ne garantit pas l'absence d'erreurs, mais cela rapproche le processus lui-même de la pratique d'ingénierie ordinaire, où la conception, l'implémentation, les tests et la sortie ne sont pas jetés en une seule étape.

Navigateur, assurance qualité et pile

La partie la plus intéressante de gstack n'est pas les skills en markdown, mais le runtime persistant du navigateur. Au lieu de lancer un nouveau navigateur pour chaque action, le système démarre un daemon Chromium headless de longue durée et communique avec lui via HTTP localhost. Cela est nécessaire à la fois pour la vitesse et pour maintenir l'état entre les étapes.

Selon la description du projet, un démarrage à froid de l'outil navigateur prend environ 3–5 secondes, et les appels ultérieurs après le lancement se situent environ à 100–200 millisecondes. De ce fait, les cookies, les onglets, le localStorage et l'état de connexion sont préservés entre les commandes. Il est particulièrement important de voir comment ce navigateur est intégré au flux d'assurance qualité.

La commande `/browse` donne à l'agent la possibilité d'entrer dans l'application, de cliquer dans l'interface, de prendre des captures d'écran et de voir où tout se casse. Et `/qa` va plus loin : il analyse le diff de la branche, identifie les routes affectées et teste précisément ces pages et scénarios qui auraient pu être impactés par les modifications. Dans un exemple du référentiel, ce mode a analysé huit fichiers modifiés, trouvé trois routes affectées et les a testées contre une instance locale de l'application — en liant les changements de code au comportement réel de l'interface.

D'un point de vue technique, gstack a également été construit pragmatiquement. Pour l'utiliser, vous avez besoin de Claude Code, Git et Bun 1.0+, et au moment de la publication, le référentiel utilisait Playwright et le paquet `diff`, avec la commande `/browse` compilée en un binaire exécutable séparé. L'ensemble peut être installé dans `~/.claude/skills/gstack` ou placé dans le `~/.claude/skills/gstack` local dans le projet pour que toute l'équipe utilise le même processus. Les auteurs expliquent le choix de Bun par des raisons simples : binaires compilables, accès natif à SQLite, exécution de TypeScript sans boilerplate supplémentaire et serveur HTTP intégré via `Bun.serve()`.

Ce que cela signifie

gstack est intéressant non comme « un autre ensemble de prompts », mais comme une tentative de transformer le coding avec IA en un pipeline répétable avec des vérifications à chaque étape. Si cette approche s'impose, le marché se déplacera non seulement vers des modèles plus puissants, mais aussi vers des couches opérationnelles plus rigides au-dessus d'eux — avec des modes séparés pour la planification, l'examen, l'assurance qualité et la sortie. Le changement principal ici est que la confiance dans l'IA se construit non pas par les promesses du modèle, mais par les étapes de vérification.

ZK
Hamidun News
Actualités IA sans bruit. Sélection éditoriale quotidienne de plus de 400 sources. Produit de Zhemal Khamidun, Head of AI chez Alpina Digital.

Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?

AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.

Qu'en pensez-vous ?
Chargement des commentaires…