Habr AI→ original

Just AI automatizó JAICP DSL: agente de IA escribe patrones y pruebas en un minuto en lugar de seis horas

Just AI demostró su agente de IA interno para la plataforma JAICP, que se encarga de la parte tediosa del trabajo con DSL: escribe patrones, selecciona…

Procesado por IA desde Habr AI; editado por Hamidun News
Just AI automatizó JAICP DSL: agente de IA escribe patrones y pruebas en un minuto en lugar de seis horas
Fuente: Habr AI. Collage: Hamidun News.
◐ Escuchar artículo

Just AI automatizó el trabajo con JAICP DSL mediante un agente de IA que escribe patrones y pruebas automatizadas en lugar de humanos. Según la estimación del equipo, una tarea que anteriormente requería alrededor de seis horas de rutina manual ahora toma aproximadamente un minuto—el desarrollador solo necesita revisar y ajustar el resultado si es necesario.

Por Qué Fue Necesario

El equipo de JAICP trabaja con un DSL especial para describir patrones que ayudan al bot a entender frases de usuarios. En teoría, la tarea parece simple: tomar "sí", "hola" o "no funciona" y describirlos como un patrón. En la práctica, todo se complica rápidamente: los usuarios escriben en argot, cometen errores, usan formas coloquiales y lo hacen en diferentes idiomas.

Para un proyecto, Just AI tuvo que considerar ruso, inglés, alemán y turco, y la traducción literal a menudo no funciona. La variabilidad resultó especialmente problemática. Un cliente proporciona una lista básica de frases, pero para una cobertura adecuada de escenarios, un desarrollador debe inventar manualmente análogos, formas morfológicas y formulaciones no estándar.

Las pruebas automatizadas tampoco resuelven completamente el problema: incluso si un patrón puede generarse mediante script, alguien aún debe preparar ejemplos de entrada, verificar la sintaxis y asegurarse de que el DSL se use correctamente. Entonces, el equipo decidió no limitarse a una solicitud regular de LLM, sino construir un agente separado que entienda el contexto de la plataforma y asuma la rutina.

Cómo Funciona el Agente

La solución se basa en Claude Sonnet 4.5, elegido por su generación estable de código DSL y buen seguimiento de instrucciones. Al agente se le dieron tres herramientas de trabajo: búsqueda de fragmentos de documentación relevantes en Jay Knowledge Hub, generación de respuestas basadas en esa base de conocimiento y verificación automática separada mediante Llm.sendRequest con GPT-4o-mini. Este stack permitió no solo "completar" frases, sino confiar en ejemplos reales de JAICP y detectar parte de los errores antes de entregar resultados al usuario.

  • Recupera ejemplos y reglas de la base de conocimiento de JAICP
  • Genera patrones y explica su estructura
  • Muestra qué frases cubre el patrón
  • Escribe pruebas automatizadas basadas en los mismos ejemplos
  • Separa respuestas por idioma y no las mezcla en un bloque

El papel clave lo jugó no el conjunto de herramientas, sino el prompt. El equipo lo dividió en lógica general, un bloque para patrones, un bloque para pruebas automatizadas y verificación final automática. Las instrucciones describieron por separado análisis semántico, morfológico y sintáctico, reglas para bloques opcionales y agrupación de sinónimos, luego obligaron al modelo a construir patrones optimizados, no enumeraciones literales. Cuando los modelos aún comenzaban a "actuar de forma imprevista", el prompt fue refinado y estructurado con la ayuda de DeepSeek, y para soporte multilingüe, añadieron una regla simple: primero determinar el idioma, luego aplicar su morfología.

Resultados y Números

El agente terminado fue conectado a Telegram para pruebas de escenarios más rápidas. Como resultado, el bot aprendió a recopilar un patrón DSL a partir de una sola frase del usuario, mostrar las variantes de respuesta cubiertas y generar pruebas automatizadas inmediatamente. Un bono adicional fue que el sistema comenzó a escribir incluso escenarios DSL, aunque no fue entrenado específicamente para esto: el modelo extrajo el conocimiento necesario de la documentación en la base de conocimiento. Este formato resultó útil no solo para desarrolladores experimentados sino también para la incorporación de principiantes que necesitan ver no solo el patrón final sino la lógica de su construcción.

"El agente también lo maneja en 1 minuto—una aceleración de 360x."

El equipo calculó los números en un ejemplo específico: hay 20 frases de un cliente que deben convertirse en patrones en cuatro idiomas, con variabilidad añadida y cobertura de pruebas. Manualmente, el ruso toma alrededor de una hora, al menos otras tres horas—para los otros idiomas, más una hora para pruebas automatizadas y aproximadamente otra hora para inventar formulaciones adicionales. En total, eso es un mínimo de seis horas de trabajo monótono sin contar revisiones. El agente produce el mismo patrón en aproximadamente un minuto, pero el humano aún no se salta la revisión final—y es exactamente eso lo que hace que este caso sea realista en lugar de promocional.

Qué Significa Esto

El caso de Just AI muestra que los agentes de IA altamente especializados ya son útiles no solo para chats y búsqueda, sino para desarrollo interno en DSL de nicho. Si un equipo tiene documentación, reglas claras y trabajo manual repetitivo, un agente puede eliminar horas de rutina sin arquitectura compleja o fine-tuning extensivo.

ZK
Hamidun News
Noticias de AI sin ruido. Selección editorial diaria de más de 400 fuentes. Producto de Zhemal Khamidun, Head of AI en Alpina Digital.

¿Quieres dejar de leer sobre IA y empezar a usarla?

AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.

¿Qué te parece?
Cargando comentarios…