Habr AI→ original

МТС запустила Метан: ИИ для поиска данных в каталоге из 500 тысяч таблиц

МТС создала ИИ-помощника Метан для быстрого поиска данных. В корпоративном каталоге МТС зарегистрировано более 500 тысяч таблиц, и раньше аналитики теряли часы

МТС запустила Метан: ИИ для поиска данных в каталоге из 500 тысяч таблиц
Source : Habr AI. Collage: Hamidun News.
◐ Écouter l'article

MTS a créé un système appelé Metan — un assistant intelligent qui aide les analystes à trouver les données nécessaires dans un catalogue d'entreprise contenant 500 mille tables en posant simplement une question en russe.

Un Catalogue Qui Ne Répond Pas aux Questions

MTS a accumulé des volumes énormes de données. Le catalogue de données de l'entreprise contient plus de 500 mille tables enregistrées. Chaque jour, des centaines de spécialistes travaillent avec ces données : analystes, ingénieurs de données, spécialistes de l'apprentissage automatique qui construisent des data marts pour les modèles ML.

Mais voici le problème : le catalogue ne fonctionne bien que si vous savez déjà ce que vous recherchez. Besoin d'une table avec des informations clients ? Vous entrez une requête, le catalogue vous donne les descriptions de champs, le propriétaire, le schéma.

Mais si vous avez une question commerciale comme « quelles tables contiennent des informations sur les clients de la région de Moscou au dernier trimestre ? » — le catalogue ne vous aidera pas. Un analyste doit le découvrir par lui-même : lire la documentation, consulter des collègues de différentes équipes, étudier les relations entre les sources.

Cela peut prendre des heures ou même des jours.

Pourquoi un Réseau de Neurones Ne Peut Pas le Résoudre Seul

Il est logique de supposer qu'un réseau de neurones pourrait résoudre cette tâche — demandez-lui simplement où trouver les données. Mais il y a un problème critique : l'IA ne s'appuie que sur les informations qui lui ont été fournies. Si les métadonnées ne contiennent pas d'informations explicites sur les relations entre les tables, sur la manière dont les données d'une source sont liées à une autre, ou sur ce que chaque terme signifie réellement dans le contexte de l'entreprise, même le modèle le plus avancé sera bloqué.

Chez MTS, cependant, il y a une coïncidence rare de deux circonstances. Au cours de 15+ ans de travail systématique sur la gouvernance des données, l'entreprise a développé une expertise sérieuse dans la façon de bien décrire les métadonnées, de structurer les relations et de documenter les processus métier dans les données. Et en même temps, des modèles LLM sont apparus qui peuvent travailler avec ces couches sémantiques structurées.

Système

Metan : Combinaison de la Gouvernance des Données et de l'IA

Metan est un nom qui abrège les mots « métadonnées » et « analytique ». C'est un système pilote que MTS teste en ce moment. Le système agit comme une interface intelligente pour les données d'entreprise : vous posez une question en langage naturel, le système comprend quelles tables et sources vous avez besoin, et fournit une réponse. Cela fonctionne précisément parce que les métadonnées chez MTS ne sont pas simplement un ensemble de descriptions. C'est un graphe de connaissances complet :

  • Tables liées à leurs descriptions et structure de champs
  • Un glossaire des termes métier de l'entreprise
  • Relations entre les tables et les sources de données
  • Informations sur les parties responsables et les propriétaires
  • Historique des dépendances et des relations entre les data marts

Sur ce graphe se trouve une couche sémantique compréhensible pour le LLM. Le modèle peut « voir » non seulement les mots et les descriptions, mais aussi les sens et les relations entre eux.

Ce Que Cela Signifie pour l'Entreprise

Metan n'est pas la première tentative d'automatiser la découverte de données dans les grandes entreprises. Mais c'est l'un des premiers systèmes qui fonctionne réellement car il est construit non pas sur l'IA pure, mais sur une combinaison de travail coûteux de gouvernance des données et de capacités modernes de LLM. Pour les entreprises comme MTS, cela signifie accélérer le travail des analystes — moins de temps à rechercher des sources et à coordonner avec les collègues, plus de temps pour une véritable analyse.

Pour l'ensemble du secteur, c'est un signal : les agents fonctionnent mieux non avec des données chaotiques, mais avec des données bien organisées et bien décrites. L'ordre et l'IA ne sont pas des ennemis, mais des partenaires.

ZK
Hamidun News
Actualités IA sans bruit. Sélection éditoriale quotidienne de plus de 400 sources. Produit de Zhemal Khamidun, Head of AI chez Alpina Digital.
Qu'en pensez-vous ?
Chargement des commentaires…