Habr AI→ original

МТС запустила Метан: ИИ для поиска данных в каталоге из 500 тысяч таблиц

МТС создала ИИ-помощника Метан для быстрого поиска данных. В корпоративном каталоге МТС зарегистрировано более 500 тысяч таблиц, и раньше аналитики теряли часы

Processado por IA de Habr AI; editado por Hamidun News
МТС запустила Метан: ИИ для поиска данных в каталоге из 500 тысяч таблиц
Fonte: Habr AI. Colagem: Hamidun News.
◐ Ouvir artigo

A MTS criou um sistema chamado Metan — um assistente inteligente que ajuda analistas a encontrar os dados necessários em um catálogo corporativo de 500 mil tabelas simplesmente fazendo uma pergunta em russo.

Um Catálogo Que Não Responde a Perguntas

A MTS acumulou volumes enormes de dados. O catálogo de dados da empresa contém mais de 500 mil tabelas registradas. Todos os dias, centenas de especialistas trabalham com esses dados: analistas, engenheiros de dados, especialistas em aprendizado de máquina que constroem data marts para modelos de ML.

Mas aqui está o problema: o catálogo funciona bem apenas se você já sabe o que está procurando. Precisa de uma tabela com informações de clientes? Você insere uma consulta, o catálogo fornece descrições de campos, o proprietário, o esquema.

Mas se você tem uma pergunta de negócios como "quais tabelas contêm informações sobre clientes na região de Moscou no último trimestre?" — o catálogo não ajudará. Um analista tem que descobrir por conta própria: ler documentação, consultar colegas de diferentes equipes, estudar relacionamentos entre fontes.

Isso pode levar horas ou até dias.

Por Que uma Rede Neural Não Consegue Resolver Sozinha

É lógico presumir que uma rede neural pudesse resolver essa tarefa — simplesmente pergunte a ela onde encontrar dados. Mas há um problema crítico: a IA se baseia apenas nas informações que lhe foram fornecidas. Se os metadados não contiverem informações explícitas sobre relacionamentos entre tabelas, sobre como os dados de uma fonte se relacionam com outra, ou sobre o que cada termo realmente significa no contexto da empresa, até o modelo mais avançado ficará preso.

Na MTS, porém, há uma coincidência rara de duas circunstâncias. Após 15+ anos de trabalho sistemático em governança de dados, a empresa desenvolveu expertise séria em como descrever adequadamente metadados, estruturar relacionamentos e documentar processos de negócio nos dados. E ao mesmo tempo, modelos de LLM apareceram que podem trabalhar com esses camadas semânticas estruturadas.

Sistema Metan: Combinando Governança de Dados e IA

Metan é um nome que abrevia as palavras "metadados" e "analytics". É um sistema piloto que a MTS está testando agora. O sistema funciona como uma interface inteligente para dados corporativos: você faz uma pergunta em linguagem humana, o sistema entende quais tabelas e fontes você precisa e fornece uma resposta. Isso funciona precisamente porque metadados na MTS não são apenas um conjunto de descrições. É um grafo de conhecimento completo:

  • Tabelas vinculadas a suas descrições e estrutura de campos
  • Um glossário dos termos de negócio da empresa
  • Relacionamentos entre tabelas e fontes de dados
  • Informações sobre partes responsáveis e proprietários
  • Histórico de dependências e relacionamentos entre data marts

Sobre esse grafo está uma camada semântica que é compreensível para o LLM. O modelo pode "ver" não apenas palavras e descrições, mas significados e relacionamentos entre eles.

O Que Isso Significa para os Negócios

Metan não é a primeira tentativa de automatizar a descoberta de dados em grandes empresas. Mas é um dos primeiros sistemas que realmente funciona porque é construído não em IA pura, mas em uma combinação de trabalho caro de governança de dados e capacidades modernas de LLM. Para empresas como a MTS, isso significa acelerar o trabalho dos analistas — menos tempo procurando por fontes e coordenando com colegas, mais tempo em análise real. Para toda a indústria, isso é um sinal: agentes funcionam melhor não com dados caóticos, mas com dados bem organizados e bem descritos. Ordem e IA não são inimigos, mas parceiros.

ZK
Hamidun News
Notícias de AI sem ruído. Seleção editorial diária de mais de 400 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.

Quer parar de ler sobre IA e começar a usar?

AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.

O que você acha?
Carregando comentários…