شرح Habr AI لماذا تحتاج الشركات إلى طبقة دلالية لكي يتعامل AI مع البيانات بدقة
شرح Habr AI لماذا تحتاج الشركات إلى طبقة دلالية بين مستودع البيانات وواجهة AI. من دونها، لا يرى النموذج سوى الجداول الخام ويبدأ في التخمين بشأن ما يجب…
معالج بواسطة الذكاء الاصطناعي من Habr AI؛ بتحرير Hamidun News
شرح Habr AI السبب في أن حتى النموذج القوي يرتكب أخطاء عند الإجابة على سؤال بسيط حول مقاييس الأعمال. بدون طبقة دلالية، تعمل الذكاء الاصطناعي مع جداول خام وتضطر للتخمين فيما تعنيه الشركة بالمبيعات والإيرادات والعميل أو الربع.
حيث ينكسر المعنى
بعبارات بسيطة، تبدو الاستعلامات أساسية: كم عدد المبيعات التي حققناها في هذا الربع، أي منتج ينمو بشكل أسرع، كم عدد العملاء العائدين. لكن داخل البيانات، تنقسم كل هذه الصياغة إلى مجموعة من التفسيرات المتنازع عليها. يمكن أن يكون الربع تقويمياً أو مالياً. يمكن أن تعني المبيعات الطلبات المدفوعة أو الشحنات أو العقود الموقعة أو الإيرادات المعترف بها. حتى الحقل الذي يحمل اسماً بريئاً مثل "المبلغ" لا يشرح شيئاً بحد ذاته إذا لم يتم تحديد السياق.
"كم عدد المبيعات التي حققناها في هذا الربع؟"
عندما يتم توصيل نموذج مباشرة بمستودع، فإنه لا يرى المنطق التجاري، بل مجموعة من الجداول والمفاتيح والأعمدة. إذا كان المخطط معقداً، يبدأ الذكاء الاصطناعي في إجراء تخمينات احتمالية: أي جدول يجب دمجه أولاً، أي حقل يجب اعتباره تاريخ المعاملة، أي عوامل تصفية يجب اعتبارها إلزامية. من هنا تأتي المشاكل النموذجية: استعلام SQL غير صحيح، رؤى جميلة لكن كاذبة، وأحياناً إجابات يستحيل التحقق منها يدوياً بدون تعريف صحيح واحد.
كيف يعمل المترجم
تحل الطبقة الدلالية هذه المشكلة كطبقة وسيطة بين البيانات الخام والتطبيق حيث يتم طرح الأسئلة باللغة الطبيعية. تصف ما يعنيه كل كيان وكيف ترتبط الجداول وأي حقول يمكن استخدامها معاً وأي مقاييس تعتبر قانونية. بالنسبة للنموذج، هذا ليس زينة فوق قاعدة البيانات، بل خريطة عمل: يتلقى قواعد واضحة للتفسير ويرتجل أقل عندما تكون التعريفات التجارية الصارمة مطلوبة.
- تعريفات موحدة للمبيعات والإيرادات والعميل
- تقاويم وعملات وحالات متفق عليها
- علاقات صريحة بين الطلبات والفواتير والمستخدمين
- مجموعة من المقاييس المختبرة للتحليل والتقارير
هذا هو السبب في أن نفس السؤال يبدأ في إعطاء نتائج متسقة بغض النظر عن من يسأله: محلل أو مدير أو روبوت دردشة داخل نظام ذكاء الأعمال. تضيق الطبقة الدلالية الفجوة بين لغة الأعمال ولغة مخطط البيانات. كما أنها تبسط تطبيق واجهات الذكاء الاصطناعي على المستودعات: بدلاً من تدريب النموذج على الاستثناءات في كل مرة، تقوم الفريق أولاً بتشكيل القواعد، ثم تسمح بالذكاء الاصطناعي بالإجابة على المستخدمين.
ما يتغير في العمل
بالنسبة لفرق التحليل، يعني هذا تقليل فك التشفير اليدوي وعدد الخلافات حول الرقم الذي يعتبر صحيحاً. بالنسبة لفرق المنتج والتجارة، يعني ذلك إجابات أسرع بدون مشاركة مستمرة لمهندسي البيانات. إذا تم تحديد الدلالات مسبقاً، تصبح تحليلات الخدمة الذاتية أكثر واقعية: يسأل الموظفون النظام باللغة العادية ويحصلون على نتائج تعتمد على تعريفات مشتركة وليس على تفسيرات عشوائية للنموذج عبر جميع الأقسام.
مع ذلك، الطبقة نفسها لا تصلح البيانات السيئة ولا تحل محل حوكمة البيانات. إذا كان لدى الشركة كتب مرجعية مكررة أو حالات طلب متضاربة أو بدون مالكي مقاييس، فإن نموذج دلالي سيرث أيضاً هذا الفوضى. لكنها تجعل المشكلة مرئية وقابلة للتشكيل: يجب تعريف المصطلحات المتنازع عليها مسبقاً وأن تكون العلاقات بين الكيانات موصوفة بحيث يمكن للأشخاص والذكاء الاصطناعي استخدامها.
في الممارسة العملية، لا يبدأ التطبيق عادة بإعادة بناء كاملة للمستودع، بل بوصف الكيانات الأكثر طلباً: الطلبات والعملاء والإيرادات وقنوات التسويق. ثم تتحقق الفريق مما إذا كانت إجابات النظام تتطابق مع كيفية حساب المقاييس في التقارير واجتماعات المنتج. يساعد هذا النهج على إطلاق البحث بالذكاء الاصطناعي عن البيانات تدريجياً، دون تعريض المستخدمين للمخطط الخام بالكامل.
هذا يقلل من خطر الأخطاء المكلفة في البداية.
ما يعنيه هذا
تصبح الطبقة الدلالية ليست بنية فوقية اختيارية، بل مكوناً أساسياً لتحليل الذكاء الاصطناعي على بيانات المؤسسة. كلما نفذت الشركات بنشاط واجهات اللغة الطبيعية، أصبح من المهم أكثر الاتفاق مسبقاً على معنى المقاييس والكيانات والعلاقات. بخلاف ذلك، حتى النموذج القوي سيجيب بشكل مقنع، لكن ليس بالضرورة بشكل صحيح.
هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟
AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.