Habr AI→ оригинал

МТС запустила Метан: ИИ для поиска данных в каталоге из 500 тысяч таблиц

МТС создала ИИ-помощника Метан для быстрого поиска данных. В корпоративном каталоге МТС зарегистрировано более 500 тысяч таблиц, и раньше аналитики теряли часы

МТС запустила Метан: ИИ для поиска данных в каталоге из 500 тысяч таблиц
Источник: Habr AI. Коллаж: Hamidun News.
◐ Слушать статью

В МТС создали систему Метан — интеллектуального помощника, который помогает аналитикам находить нужные данные в корпоративном каталоге из 500 тысяч таблиц просто задав вопрос на русском языке.

Каталог, который не отвечает на вопросы В МТС накоплены чудовищные объёмы данных.

Дата-каталог компании содержит свыше 500 тысяч зарегистрированных таблиц. Каждый день с этими данными работают сотни специалистов: аналитики, инженеры данных, специалисты по машинному обучению, которые строят витрины для ML-моделей. Но вот в чём проблема: каталог хорошо работает только если вы уже знаете, что вы ищете. Нужна таблица с информацией о клиентах? Вы вводите запрос, каталог выдаёт вам описание полей, владельца, схему. Но если перед вами стоит бизнес-вопрос вроде «какие таблицы содержат информацию о клиентах в регионе Москва за последний квартал?» — каталог не поможет. Аналитику приходится разбираться самостоятельно: читать документацию, консультироваться с коллегами из разных команд, изучать связи между источниками. Это может занять часы или даже дни.

Почему нейросеть сама не справится

Логично предположить, что нейросеть могла бы решить эту задачу — просто спроси её, где найти данные. Но есть критическая проблема: ИИ опирается только на ту информацию, которую ему дали. Если в метаданных нет явной информации о связях между таблицами, о том, как данные одного источника связаны с другим, или о том, что такое на самом деле каждый термин в контексте компании, то даже самая продвинутая модель застопорится. В МТС, однако, сложилось редкое совпадение двух обстоятельств. За 15+ лет систематической работы над data governance компания выработала серьёзную экспертизу в том, как правильно описывать метаданные, структурировать связи, документировать бизнес-процессы в данных. И одновременно появились LLM-модели, которые умеют работать с такими структурированными семантическими слоями.

Система

Метан: объединение data governance и ИИ Метан — это название, которое сокращает слова «метаданные» и «аналитика». Это пилотная система, которую МТС тестирует прямо сейчас. Система действует как интеллектуальный интерфейс к корпоративным данным: вы задаёте вопрос на человеческом языке, система понимает, какие таблицы и источники вам нужны, и выдаёт ответ.

Работает это именно потому что метаданные в МТС — это не просто набор описаний. Это полноценный граф знаний: Таблицы, привязанные к своим описаниям и структуре полей Глоссарий бизнес-терминов компании Связи между таблицами и источниками данных Информация об ответственных и владельцах * История зависимостей и связей между витринами На этот граф накладывается семантический слой, понятный для LLM. Модель может «видеть» не просто слова и описания, а смыслы и отношения между ними.

Что это значит для бизнеса

Метан — не первая попытка автоматизировать поиск данных в крупных компаниях. Но это одна из первых систем, которая работает по-настоящему, потому что построена не на чистом ИИ, а на комбинации дорогостоящей работы по data governance и современных способностей LLM. Для компаний вроде МТС это означает ускорение работы аналитиков — меньше времени на поиск источников и координацию с коллегами, больше времени на реальный анализ. Для всей отрасли это сигнал: агенты работают лучше не с хаотичными данными, а с хорошо организованными и описанными данными. Порядок и ИИ — это не враги, а партнёры.

ЖХ
Hamidun News
AI‑новости без шума. Ежедневный редакторский отбор из 400+ источников. Продукт Жемала Хамидуна, Head of AI в Alpina Digital.
Что вы думаете?
Загружаем комментарии…