Just AI a automatisé JAICP DSL : agent IA écrit des motifs et des tests en une minute au lieu de six heures
Just AI a démontré son agent IA interne pour la plateforme JAICP, qui gère la partie fastidieuse du travail avec DSL : écriture de motifs, sélection de…
Traité par IA depuis Habr AI ; édité par Hamidun News
Just AI a automatisé le travail avec JAICP DSL grâce à un agent IA qui écrit des motifs et des tests automatisés à la place des humains. Selon l'estimation de l'équipe, une tâche qui prenait auparavant environ six heures de travail manuel répétitif ne prend désormais qu'environ une minute—le développeur n'a qu'à examiner et ajuster le résultat si nécessaire.
Pourquoi C'était Nécessaire
L'équipe de JAICP travaille avec un DSL spécial pour décrire des motifs qui aident le bot à comprendre les phrases des utilisateurs. Sur le papier, la tâche semble simple : prendre « oui », « bonjour » ou « ça ne marche pas » et les décrire comme un modèle. En pratique, tout se complique rapidement : les utilisateurs écrivent en argot, font des erreurs, utilisent des formes conversationnelles et le font dans différentes langues.
Pour un projet, Just AI a dû tenir compte du russe, de l'anglais, de l'allemand et du turc, et la traduction littérale ne fonctionne souvent pas. La variabilité s'avéra particulièrement problématique. Un client fournit une liste de base de phrases, mais pour une couverture correcte des scénarios, un développeur doit manuellement inventer des analogues, des formes morphologiques et des formulations non standard.
Les tests automatisés ne résolvent pas non plus le problème complètement : même si un motif peut être généré par script, quelqu'un doit toujours préparer des exemples d'entrée, vérifier la syntaxe et s'assurer que le DSL est utilisé correctement. L'équipe a donc décidé de ne pas se limiter à une simple demande à un LLM, mais de construire un agent séparé qui comprend le contexte de la plateforme et prend en charge la routine.
Comment Fonctionne l'Agent
La solution est basée sur Claude Sonnet 4.5, choisi pour sa génération stable de code DSL et sa bonne capacité à suivre les instructions. L'agent a reçu trois outils de travail : la recherche de fragments de documentation pertinents dans Jay Knowledge Hub, la génération de réponses basées sur cette base de connaissances et une vérification automatique séparée via Llm.sendRequest avec GPT-4o-mini. Cette pile a permis non seulement de « remplir » des phrases, mais de s'appuyer sur des exemples réels de JAICP et de détecter certaines erreurs avant de livrer les résultats à l'utilisateur.
- Récupère les exemples et les règles de la base de connaissances JAICP
- Génère des motifs et explique leur structure
- Montre quelles phrases le modèle couvre
- Écrit des tests automatisés basés sur les mêmes exemples
- Sépare les réponses par langue et ne les mélange pas dans un seul bloc
Le rôle clé a été joué non par l'ensemble des outils, mais par le prompt. L'équipe l'a divisé en logique générale, un bloc pour les motifs, un bloc pour les tests automatisés et une vérification finale automatique. Les instructions décrivaient séparément l'analyse sémantique, morphologique et syntaxique, les règles des blocs facultatifs et le regroupement des synonymes, puis obligeaient le modèle à construire des motifs optimisés, et non des énumérations littérales. Quand les modèles ont quand même commencé à « agir de manière imprévisible », le prompt a été affiné et structuré avec l'aide de DeepSeek, et pour le support multilingue, ils ont ajouté une règle simple : d'abord déterminer la langue, puis appliquer sa morphologie.
Résultats et Chiffres
L'agent terminé a été connecté à Telegram pour tester les scénarios plus rapidement. En résultat, le bot a appris à assembler un motif DSL à partir d'une seule phrase d'utilisateur, montrer les variantes de répliques couvertes et générer immédiatement des tests automatisés. Un bonus supplémentaire a été que le système a commencé à écrire même des scénarios DSL, bien qu'il n'ait pas été spécifiquement entraîné pour cela : le modèle a tiré les connaissances nécessaires de la documentation dans la base de connaissances. Ce format s'est avéré utile non seulement pour les développeurs expérimentés, mais aussi pour l'intégration des débutants qui ont besoin de voir non seulement le modèle final, mais aussi la logique de sa construction.
« L'agent aussi le gère en 1 minute—une accélération de 360x. »
L'équipe a calculé les chiffres sur un exemple spécifique : il y a 20 phrases d'un client qui doivent être converties en motifs dans quatre langues, avec variabilité ajoutée et couverture de tests. Manuellement, le russe prend environ une heure, au moins trois heures de plus—pour les autres langues, plus une heure pour les tests automatisés et environ une autre heure pour inventer des formulations supplémentaires. Au total, c'est un minimum de six heures de travail monotone sans compter les révisions. L'agent produit le même motif en environ une minute, mais l'humain ne saute pas encore la révision finale—et c'est exactement ce qui rend ce cas réaliste plutôt que promotionnel.
Ce Que Cela Signifie
Le cas Just AI montre que les agents IA fortement spécialisés sont déjà utiles non seulement pour les chats et la recherche, mais aussi pour le développement interne sur des DSL de niche. Si une équipe a une documentation, des règles claires et un travail manuel répétitif, un agent peut éliminer des heures de routine sans architecture complexe ni fine-tuning extensif.
Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?
AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.