Sistema basado en LLM redujo preparación de mapas de control de calidad en fábrica metalúrgica de 2 horas a 5 minutos
En una fábrica metalúrgica, un sistema LLM fue entrenado para leer escaneos de GOST y ensamblar mapas de control de calidad en 3–5 minutos en lugar de dos…
Procesado por IA desde Habr AI; editado por Hamidun News
Un estudio de caso práctico de una empresa metalúrgica muestra que los grandes modelos de lenguaje ya son capaces no solo de responder preguntas, sino también de aliviar a los ingenieros de las pesadas tareas rutinarias de cumplimiento normativo. El sistema fue entrenado para leer escaneos de GOSTs soviéticos y ensamblar automáticamente mapas de control en 3–5 minutos en lugar de más de dos horas de trabajo manual. En términos de coste de mano de obra, según la evaluación del autor del proyecto, esto elimina un volumen de tareas equivalente al trabajo de tres tecnólogos de procesos.
El problema era muy concreto. En una empresa de ciclo completo, aproximadamente 3.200 personas trabajan, y el catálogo de productos supera 4.
500 artículos y crece constantemente. Para cada producto, un tecnólogo tenía que abrir un GOST, OST u otro documento normativo, encontrar las tablas y notas necesarias, sustituir parámetros como grado de acero, diámetro de la pieza y grupo, y luego rellenar manualmente más de 40 parámetros de control. La dificultad era que había más de doscientos documentos, y una parte significativa de ellos existía como escaneos PDF bastante incómodos de la era soviética.
La primera idea fue un analizador convencional, pero rápidamente fracasó. El formato de los documentos normativos era demasiado heterogéneo: en un documento, los valores necesarios estaban en filas de tablas, en otro estaban ocultos en notas, en un tercero estaban dispersos por el texto con referencias a otras secciones. Un esquema simple de extracción basado en plantillas fracasa aquí porque la tarea requiere entender el significado del documento, no solo su estructura visual.
Por lo tanto, el autor recurrió a LLM y construyó un esquema donde el modelo recibía como entrada un PDF del estándar, parámetros del producto y un conjunto de reglas sobre cómo determinar parámetros de control específicos. La siguiente hipótesis parecía lógica: crear un único prompt universal para todos los documentos normativos. En la primera prueba, este enfoque mostró resultados decentes.
Según el autor, Claude Sonnet 4.6 en modo thinking identificó correctamente el 85% de los parámetros para un GOST, y GPT 5.4 — 72%.
Pero en documentos posteriores, la universalidad se desmoralizó. Los modelos se confundieron con tablas anidadas, interpretaron incorrectamente condiciones de contorno como "no menos de" y "no más de", e incluso a veces pasaron por alto constantes o vínculos entre secciones. Resultó que el elegante enfoque general era inferior aquí a una arquitectura más estrecha pero manejable.
La solución funcional surgió después de desglosar el catálogo de productos según el principio de Pareto. Resultó que el 80% de los productos de la planta se describen mediante aproximadamente el 18% de los GOSTs. Para el piloto, seleccionaron 20 de los documentos más utilizados e crearon un prompt separado para cada uno con reglas específicas: dónde buscar el parámetro, en qué tabla o sección se describe y cómo interpretar casos controvertidos.
El sistema recibía un PDF y características del producto como entrada, y devolvía una tabla con el parámetro, valor y referencia a la ubicación en el estándar como salida. Cuando ocurría un error, el autor enviaba una captura de pantalla al diálogo, mostraba la respuesta correcta y pedía actualizar la regla para que la falla no se repitiera. Se gastaron nueve iteraciones y 14 días de trabajo en la refinación, después de lo cual la extracción de parámetros para los GOSTs seleccionados comenzó a funcionar sin errores.
Actualmente, el proyecto se está trasladando del modo experimental a un formato más conveniente para la producción. Las reglas se están extrayendo de los prompts hacia una hoja de cálculo de Excel para que los tecnólogos puedan editar la lógica por sí mismos sin profundizar en la ingeniería de prompts. El modelo ahora recibe no solo un PDF y parámetros del producto como entrada, sino también esta tabla de reglas, y devuelve datos en un formato adecuado para cargar en el sistema de información interna de la empresa.
Esta capa hace que la solución sea escalable: se pueden agregar gradualmente nuevos estándares sin vincular todo el soporte a un único desarrollador. La conclusión principal de este estudio de caso es simple: en la industria, los LLMs funcionan mejor no como "inteligencia universal para todas las ocasiones", sino como una herramienta cuidadosamente ajustada para una clase específica de documentos. Si comienza con los documentos normativos más comunes, hace que el modelo indique la fuente de cada parámetro y mantiene las reglas editables para especialistas en la materia, la IA se transforma de una demostración en un mecanismo de producción con una economía clara.
Tal enfoque bien podría repetirse no solo en metalurgia, sino también en ingeniería mecánica, construcción, química, farmacéutica y energía—en todos los lugares donde las personas aún transfieren manualmente datos de reglamentos a sistemas de trabajo.
¿Quieres dejar de leer sobre IA y empezar a usarla?
AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.