Just AI automatizou JAICP DSL: agente de IA escreve padrões e testes em um minuto em vez de seis horas
Just AI demonstrou seu agente de IA interno para a plataforma JAICP, que assume a parte entediante do trabalho com DSL: escreve padrões, seleciona variações…
Processado por IA de Habr AI; editado por Hamidun News
Just AI automatizou o trabalho com JAICP DSL por meio de um agente de IA que escreve padrões e testes automatizados em vez de humanos. Segundo a estimativa da equipe, uma tarefa que anteriormente levava cerca de seis horas de rotina manual agora leva aproximadamente um minuto—o desenvolvedor apenas precisa revisar e ajustar o resultado se necessário.
Por Que Foi Necessário
A equipe JAICP trabalha com uma DSL especial para descrever padrões que ajudam o bot a entender frases do usuário. No papel, a tarefa parece simples: pegar "sim", "olá" ou "não funciona" e descrevê-los como um modelo. Na prática, tudo fica complicado rapidamente: os usuários escrevem em gíria, cometem erros, usam formas coloquiais e fazem isso em diferentes idiomas.
Para um projeto, Just AI teve que levar em conta russo, inglês, alemão e turco, e a tradução literal muitas vezes não funciona. A variabilidade provou ser especialmente problemática. Um cliente fornece uma lista básica de frases, mas para uma cobertura adequada de cenários, um desenvolvedor deve inventar manualmente análogos, formas morfológicas e formulações não padrão.
Os testes automatizados também não resolvem completamente o problema: mesmo que um padrão possa ser gerado por script, alguém ainda precisa preparar exemplos de entrada, verificar a sintaxe e garantir que a DSL seja usada corretamente. Então a equipe decidiu não se limitar a uma solicitação regular de LLM, mas construir um agente separado que entenda o contexto da plataforma e assuma a rotina.
Como o Agente Funciona
A solução se baseia em Claude Sonnet 4.5, escolhido por geração estável de código DSL e bom seguimento de instruções. O agente recebeu três ferramentas de trabalho: busca por documentação relevante no Jay Knowledge Hub, geração de respostas baseadas nessa base de conhecimento e verificação automática separada via Llm.sendRequest com GPT-4o-mini. Este stack permitiu não apenas "preencher" frases, mas contar com exemplos reais do JAICP e detectar parte dos erros antes de entregar resultados ao usuário.
- Recupera exemplos e regras da base de conhecimento JAICP
- Gera padrões e explica sua estrutura
- Mostra quais frases o modelo cobre
- Escreve testes automatizados baseados nos mesmos exemplos
- Separa respostas por idioma e não as mistura em um bloco
O papel-chave foi desempenhado não pelo conjunto de ferramentas, mas pelo prompt. A equipe o dividiu em lógica geral, um bloco para padrões, um bloco para testes automatizados e verificação final automática. As instruções descreveram separadamente análise semântica, morfológica e sintática, regras para blocos opcionais e agrupamento de sinônimos, depois forçaram o modelo a construir padrões otimizados, não enumerações literais. Quando os modelos ainda começavam a "agir contra as ordens", o prompt foi refinado e estruturado com a ajuda do DeepSeek, e para suporte multilíngue, adicionaram uma regra simples: primeiro determinar o idioma, depois aplicar sua morfologia.
Resultados e Números
O agente finalizado foi conectado ao Telegram para testes de cenário mais rápidos. Como resultado, o bot aprendeu a reunir um padrão DSL a partir de uma única frase do usuário, mostrar as variantes de fala cobertas e gerar testes automatizados imediatamente. Um bônus adicional foi que o sistema começou a escrever até cenários DSL, embora não tenha sido especificamente treinado para isso: o modelo puxou o conhecimento necessário da documentação na base de conhecimento. Este formato se mostrou útil não apenas para desenvolvedores experientes, mas também para integração de iniciantes que precisam ver não apenas o modelo final, mas a lógica de sua construção.
"O agente também lida com isso em 1 minuto—uma aceleração de 360x."
A equipe calculou os números em um exemplo específico: existem 20 frases de um cliente que precisam ser convertidas em padrões em quatro idiomas, com variabilidade adicionada e cobertura de testes. Manualmente, o russo leva cerca de uma hora, pelo menos mais três horas—para os outros idiomas, mais uma hora para testes automatizados e mais uma hora para inventar formulações adicionais. No total, são no mínimo seis horas de trabalho monótono sem contar revisões. O agente produz o mesmo modelo em cerca de um minuto, mas o humano ainda não pula a revisão final—e é exatamente isso que torna este caso realista em vez de promocional.
O Que Isso Significa
O caso Just AI mostra que agentes de IA estreitamente especializados já são úteis não apenas para chats e buscas, mas para desenvolvimento interno em DSLs de nicho. Se uma equipe tem documentação, regras claras e trabalho manual repetitivo, um agente pode eliminar horas de rotina sem arquitetura complexa ou fine-tuning extensivo.
Quer parar de ler sobre IA e começar a usar?
AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.