МТС запустила Метан: ИИ для поиска данных в каталоге из 500 тысяч таблиц
МТС создала ИИ-помощника Метан для быстрого поиска данных. В корпоративном каталоге МТС зарегистрировано более 500 тысяч таблиц, и раньше аналитики теряли часы

MTS ha creado un sistema llamado Metan — un asistente inteligente que ayuda a los analistas a encontrar los datos necesarios en un catálogo corporativo de 500 mil tablas simplemente haciendo una pregunta en ruso.
Un Catálogo Que No Responde Preguntas
MTS ha acumulado enormes volúmenes de datos. El catálogo de datos de la empresa contiene más de 500 mil tablas registradas. Cada día, cientos de especialistas trabajan con estos datos: analistas, ingenieros de datos, especialistas en aprendizaje automático que construyen data marts para modelos de ML.
Pero aquí está el problema: el catálogo funciona bien solo si ya sabe qué está buscando. ¿Necesita una tabla con información de clientes? Ingresa una consulta, el catálogo le proporciona descripciones de campos, el propietario, el esquema.
Pero si tiene una pregunta empresarial como "¿qué tablas contienen información sobre clientes en la región de Moscú en el último trimestre?" — el catálogo no le ayudará. Un analista tiene que averiguarlo por su cuenta: leer documentación, consultar con colegas de diferentes equipos, estudiar relaciones entre fuentes.
Esto puede tomar horas o incluso días.
Por Qué Una Red Neuronal No Puede Resolver Esto Sola
Es lógico suponer que una red neuronal podría resolver esta tarea — simplemente pregúntele dónde encontrar datos. Pero hay un problema crítico: la IA se basa únicamente en la información que se le ha proporcionado. Si los metadatos no contienen información explícita sobre relaciones entre tablas, sobre cómo los datos de una fuente se relacionan con otra, o sobre lo que realmente significa cada término en el contexto de la empresa, incluso el modelo más avanzado se atascará.
En MTS, sin embargo, hay una coincidencia rara de dos circunstancias. Durante 15+ años de trabajo sistemático en gobernanza de datos, la empresa ha desarrollado una experiencia seria en cómo describir adecuadamente metadatos, estructurar relaciones y documentar procesos empresariales en datos. Y al mismo tiempo, han aparecido modelos LLM que pueden trabajar con tales capas semánticas estructuradas.
Sistema Metan: Combinando Gobernanza de Datos e IA
Metan es un nombre que abrevia las palabras "metadatos" y "analítica". Es un sistema piloto que MTS está probando en este momento. El sistema actúa como una interfaz inteligente para datos corporativos: hace una pregunta en lenguaje humano, el sistema entiende qué tablas y fuentes necesita y proporciona una respuesta. Esto funciona precisamente porque los metadatos en MTS no son solo un conjunto de descripciones. Es un grafo de conocimiento completo:
- Tablas vinculadas a sus descripciones y estructura de campos
- Un glosario de términos empresariales de la empresa
- Relaciones entre tablas y fuentes de datos
- Información sobre partes responsables y propietarios
- Historial de dependencias y relaciones entre data marts
Sobre este grafo hay una capa semántica que es comprensible para el LLM. El modelo puede "ver" no solo palabras y descripciones, sino significados y relaciones entre ellos.
Lo Que Esto Significa para el Negocio
Metan no es el primer intento de automatizar el descubrimiento de datos en grandes empresas. Pero es uno de los primeros sistemas que realmente funciona porque está construido no con IA pura, sino con una combinación de trabajo costoso de gobernanza de datos y capacidades modernas de LLM. Para empresas como MTS, esto significa acelerar el trabajo de los analistas — menos tiempo buscando fuentes y coordinando con colegas, más tiempo en análisis real. Para toda la industria, esta es una señal: los agentes funcionan mejor no con datos caóticos, sino con datos bien organizados y bien descritos. El orden y la IA no son enemigos, sino socios.