Habr AI→ original

Just AI automatizou JAICP DSL: agente de IA escreve padrões e testes em um minuto em vez de seis horas

Just AI demonstrou seu agente de IA interno para a plataforma JAICP, que assume a parte entediante do trabalho com DSL: escreve padrões, seleciona variações…

Processado por IA de Habr AI; editado por Hamidun News
Just AI automatizou JAICP DSL: agente de IA escreve padrões e testes em um minuto em vez de seis horas
Fonte: Habr AI. Colagem: Hamidun News.
◐ Ouvir artigo

Just AI automatizou o trabalho com JAICP DSL por meio de um agente de IA que escreve padrões e testes automatizados em vez de humanos. Segundo a estimativa da equipe, uma tarefa que anteriormente levava cerca de seis horas de rotina manual agora leva aproximadamente um minuto—o desenvolvedor apenas precisa revisar e ajustar o resultado se necessário.

Por Que Foi Necessário

A equipe JAICP trabalha com uma DSL especial para descrever padrões que ajudam o bot a entender frases do usuário. No papel, a tarefa parece simples: pegar "sim", "olá" ou "não funciona" e descrevê-los como um modelo. Na prática, tudo fica complicado rapidamente: os usuários escrevem em gíria, cometem erros, usam formas coloquiais e fazem isso em diferentes idiomas.

Para um projeto, Just AI teve que levar em conta russo, inglês, alemão e turco, e a tradução literal muitas vezes não funciona. A variabilidade provou ser especialmente problemática. Um cliente fornece uma lista básica de frases, mas para uma cobertura adequada de cenários, um desenvolvedor deve inventar manualmente análogos, formas morfológicas e formulações não padrão.

Os testes automatizados também não resolvem completamente o problema: mesmo que um padrão possa ser gerado por script, alguém ainda precisa preparar exemplos de entrada, verificar a sintaxe e garantir que a DSL seja usada corretamente. Então a equipe decidiu não se limitar a uma solicitação regular de LLM, mas construir um agente separado que entenda o contexto da plataforma e assuma a rotina.

Como o Agente Funciona

A solução se baseia em Claude Sonnet 4.5, escolhido por geração estável de código DSL e bom seguimento de instruções. O agente recebeu três ferramentas de trabalho: busca por documentação relevante no Jay Knowledge Hub, geração de respostas baseadas nessa base de conhecimento e verificação automática separada via Llm.sendRequest com GPT-4o-mini. Este stack permitiu não apenas "preencher" frases, mas contar com exemplos reais do JAICP e detectar parte dos erros antes de entregar resultados ao usuário.

  • Recupera exemplos e regras da base de conhecimento JAICP
  • Gera padrões e explica sua estrutura
  • Mostra quais frases o modelo cobre
  • Escreve testes automatizados baseados nos mesmos exemplos
  • Separa respostas por idioma e não as mistura em um bloco

O papel-chave foi desempenhado não pelo conjunto de ferramentas, mas pelo prompt. A equipe o dividiu em lógica geral, um bloco para padrões, um bloco para testes automatizados e verificação final automática. As instruções descreveram separadamente análise semântica, morfológica e sintática, regras para blocos opcionais e agrupamento de sinônimos, depois forçaram o modelo a construir padrões otimizados, não enumerações literais. Quando os modelos ainda começavam a "agir contra as ordens", o prompt foi refinado e estruturado com a ajuda do DeepSeek, e para suporte multilíngue, adicionaram uma regra simples: primeiro determinar o idioma, depois aplicar sua morfologia.

Resultados e Números

O agente finalizado foi conectado ao Telegram para testes de cenário mais rápidos. Como resultado, o bot aprendeu a reunir um padrão DSL a partir de uma única frase do usuário, mostrar as variantes de fala cobertas e gerar testes automatizados imediatamente. Um bônus adicional foi que o sistema começou a escrever até cenários DSL, embora não tenha sido especificamente treinado para isso: o modelo puxou o conhecimento necessário da documentação na base de conhecimento. Este formato se mostrou útil não apenas para desenvolvedores experientes, mas também para integração de iniciantes que precisam ver não apenas o modelo final, mas a lógica de sua construção.

"O agente também lida com isso em 1 minuto—uma aceleração de 360x."

A equipe calculou os números em um exemplo específico: existem 20 frases de um cliente que precisam ser convertidas em padrões em quatro idiomas, com variabilidade adicionada e cobertura de testes. Manualmente, o russo leva cerca de uma hora, pelo menos mais três horas—para os outros idiomas, mais uma hora para testes automatizados e mais uma hora para inventar formulações adicionais. No total, são no mínimo seis horas de trabalho monótono sem contar revisões. O agente produz o mesmo modelo em cerca de um minuto, mas o humano ainda não pula a revisão final—e é exatamente isso que torna este caso realista em vez de promocional.

O Que Isso Significa

O caso Just AI mostra que agentes de IA estreitamente especializados já são úteis não apenas para chats e buscas, mas para desenvolvimento interno em DSLs de nicho. Se uma equipe tem documentação, regras claras e trabalho manual repetitivo, um agente pode eliminar horas de rotina sem arquitetura complexa ou fine-tuning extensivo.

ZK
Hamidun News
Notícias de AI sem ruído. Seleção editorial diária de mais de 400 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.

Quer parar de ler sobre IA e começar a usar?

AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.

O que você acha?
Carregando comentários…