Habr AI→ المصدر

МТС запустила Метан: ИИ для поиска данных в каталоге из 500 тысяч таблиц

МТС создала ИИ-помощника Метан для быстрого поиска данных. В корпоративном каталоге МТС зарегистрировано более 500 тысяч таблиц, и раньше аналитики теряли часы

МТС запустила Метан: ИИ для поиска данных в каталоге из 500 тысяч таблиц
المصدر: Habr AI. كولاج: Hamidun News.
◐ استمع للمقال

لقد أنشأت MTS نظاماً يسمى Metan — مساعد ذكي يساعد المحللين على العثور على البيانات الضرورية في كتالوج مؤسسي يحتوي على 500 ألف جدول بمجرد طرح سؤال باللغة الروسية.

كتالوج لا يجيب على الأسئلة

لقد جمعت MTS أحجاماً ضخمة من البيانات. يحتوي كتالوج البيانات الخاص بالشركة على أكثر من 500 ألف جدول مسجل. يعمل مئات المتخصصين مع هذه البيانات كل يوم: المحللون ومهندسو البيانات والمتخصصون في التعلم الآلي الذين يبنون مستودعات بيانات لنماذج ML.

لكن هنا تكمن المشكلة: الكتالوج يعمل بشكل جيد فقط إذا كنت تعرف بالفعل ما تبحث عنه. هل تحتاج إلى جدول يحتوي على معلومات العملاء؟ تدخل استعلاماً، والكتالوج يعطيك وصفات الحقول والمالك والمخطط. لكن إذا كان لديك سؤال تجاري مثل "أي جداول تحتوي على معلومات عن العملاء في منطقة موسكو في الربع الأخير؟" — فالكتالوج لن يساعدك.

يتعين على المحلل أن يكتشف بمفرده: يقرأ الوثائق، يستشير الزملاء من فرق مختلفة، يدرس العلاقات بين المصادر. قد يستغرق هذا ساعات أو حتى أياماً.

لماذا الشبكة العصبية لا تستطيع التعامل معه وحدها

من المنطقي افتراض أن شبكة عصبية يمكن أن تحل هذه المهمة — اسألها ببساطة أين تجد البيانات. لكن هناك مشكلة حرجة: الذكاء الاصطناعي يعتمد فقط على المعلومات التي تم إعطاؤه إياها. إذا لم تكن البيانات الوصفية تحتوي على معلومات صريحة عن العلاقات بين الجداول، حول كيفية ارتباط البيانات من مصدر واحد بآخر، أو حول معنى كل مصطلح فعلياً في سياق الشركة، فحتى النموذج الأكثر تقدماً سيتوقف. في MTS، مع ذلك، هناك تزامن نادر لظرفين. على مدار 15+ سنة من العمل المنهجي على حوكمة البيانات، طورت الشركة خبرة جادة في كيفية وصف البيانات الوصفية بشكل صحيح وتنظيم العلاقات وتوثيق العمليات التجارية في البيانات. وفي الوقت نفسه، ظهرت نماذج LLM التي يمكنها العمل مع هذه الطبقات الدلالية المنظمة.

نظام Metan: الجمع بين حوكمة البيانات والذكاء الاصطناعي

Metan هو اسم يختصر كلمات "البيانات الوصفية" و"التحليلات". إنه نظام تجريبي تختبره MTS الآن. يعمل النظام كواجهة ذكية للبيانات المؤسسية: تطرح سؤالاً بلغة طبيعية، يفهم النظام الجداول والمصادر التي تحتاجها، ويوفر إجابة. يعمل هذا بالضبط لأن البيانات الوصفية في MTS ليست مجرد مجموعة من الأوصاف. إنها رسم بياني لمعارف كامل:

  • الجداول المرتبطة بأوصافها وهيكل الحقول
  • معجم مصطلحات الأعمال في الشركة
  • العلاقات بين الجداول ومصادر البيانات
  • معلومات الأطراف المسؤولة والمالكين
  • سجل التبعيات والعلاقات بين مستودعات البيانات

على هذا الرسم البياني تكون هناك طبقة دلالية مفهومة بواسطة نموذج LLM. يمكن للنموذج أن "يرى" ليس فقط الكلمات والأوصاف، بل المعاني والعلاقات بينها.

ما يعنيه هذا للأعمال

Metan ليس المحاولة الأولى لأتمتة اكتشاف البيانات في الشركات الكبرى. لكنها واحدة من أوائل الأنظمة التي تعمل فعلاً لأنها مبنية ليس على الذكاء الاصطناعي الخالص، بل على مزيج من العمل المكلف لحوكمة البيانات والقدرات الحديثة لنموذج LLM. بالنسبة لشركات مثل MTS، يعني هذا تسريع عمل المحللين — وقت أقل في البحث عن المصادر والتنسيق مع الزملاء، ووقت أكثر للتحليل الفعلي. بالنسبة للصناعة بأكملها، هذه إشارة: تعمل الوكلاء بشكل أفضل ليس مع البيانات الفوضوية، بل مع البيانات المنظمة بشكل جيد والموصوفة بشكل جيد. النظام والذكاء الاصطناعي ليسا أعداء، بل شركاء.

ZK
Hamidun News
أخبار الذكاء الاصطناعي بدون ضوضاء. اختيار تحريري يومي من أكثر من 400 مصدر. منتج من جمال حميدون، رئيس الذكاء الاصطناعي في Alpina Digital.
ما رأيك؟
جارٍ تحميل التعليقات…