TNW→ المصدر

لماذا يكذب وكلاء AI بشأن الحاضر: مشكلة البيانات القديمة

تتدرّب نماذج اللغة على لقطات تاريخية من البيانات وتقدّم بثقة معلومات قديمة على أنها حديثة. هذه مشكلة بنيوية تزداد خطورتها بالنسبة إلى وكلاء AI الذين يتخذون…

معالج بواسطة الذكاء الاصطناعي من TNW؛ بتحرير Hamidun News
لماذا يكذب وكلاء AI بشأن الحاضر: مشكلة البيانات القديمة
المصدر: TNW. كولاج: Hamidun News.
◐ استمع للمقال

تخيل: تطلب من مساعد ذكاء اصطناعي أن يتحقق ما إذا كان الرئيس التنفيذي لشركة تهمك قد تغير. يرد النموذج بثقة، ويذكر اسماً، ومنصباً، وتاريخ التعيين. كل شيء يبدو خالياً من العيوب — باستثناء واحد. تغيرت الإدارة منذ أسبوع، لكن النموذج لا يعرف ذلك. إنه لا يكذب عن قصد — إنه ببساطة عالق في الماضي.

هذا ليس سيناريو افتراضياً، بل هو الواقع اليومي للتفاعل مع نماذج اللغة الكبيرة. المشكلة ذات طابع بنيوي: تدرب النماذج اللغوية الكبيرة على لقطات تاريخية من البيانات، ومعرفتهم بالعالم حرفياً متجمدة في لحظة آخر تدريب. بين انتهاء التدريب واللحظة التي يطرح فيها المستخدم سؤالاً، قد تمضي عدة أشهر — وخلال تلك الفترة يتمكن العالم من التغيير عشرات المرات. تغير الشركات قيادتها، وتدخل القوانين حيز التنفيذ، والاكتشافات العلمية تقلب المفاهيم الراسخة. ومع ذلك، يستمر النموذج في إعادة إنتاج صورة للعالم لا تتطابق بعد الآن مع الواقع.

تصبح هذه المشكلة حادة بشكل خاص في سياق وكلاء الذكاء الاصطناعي — الأنظمة المستقلة التي لا تجيب على الأسئلة فحسب بل تتخذ القرارات وتنفذ الإجراءات نيابة عن المستخدم. عندما يجدول وكيل الذكاء الاصطناعي اجتماعاً مع شخص ترك بالفعل الشركة، أو يصيغ تحليلات استثمارية بناءً على بيانات مالية قديمة، فإن العواقب تتجاوز بكثير الإزعاج. نتحدث عن خسائر مالية حقيقية وفرص ضائعة وثقة متآكلة في التكنولوجيا ككل. تواجه صناعة تروج بنشاط لوكلاء الذكاء الاصطناعي باعتبارهم الخطوة الكبيرة التالية بعد روبوتات الدردشة خطر أزمة ثقة إذا لم تحل المشكلة الأساسية لحداثة البيانات.

أصبحت تقنية البحث الحي مع التثبيت أحد أكثر الأساليب الواعدة لحل هذه المهمة — ربط إجابات النموذج بنتائج البحث في الوقت الفعلي. جوهر الطريقة هو أنه قبل إنشاء إجابة، يصل النظام إلى فهارس البحث، ويستخرج معلومات طازجة، ويستخدمها كسياق للصياغة. فعلياً، يتوقف النموذج عن الاعتماد حصرياً على "ذكرياته" من فترة التدريب ويبدأ في الاعتماد على مصادر حالية. دمجت جوجل بالفعل آلية كهذه في منتجات الذكاء الاصطناعي الخاصة بها من خلال التثبيت مع بحث جوجل، وتطور مايكروسوفت حلولاً مماثلة مع بينج، وعدد من الشركات الناشئة، بما فيها Perplexity AI، تفعل الشيء نفسه.

ومع ذلك، البحث الحي مع التثبيت ليس حلاً سحرياً. تنشئ التقنية مجموعتها الخاصة من المشاكل التي لا تزال الصناعة بحاجة إلى حلها. أولاً، تعتمد جودة الإجابة الآن ليس فقط على النموذج، بل أيضاً على جودة نتائج البحث. إذا انتهت المعلومات الخاطئة أو الصفحة القديمة في أعلى النتائج، فإن النموذج يخاطر بإعادة إنتاج الخطأ بثقة أكبر — مدعومة الآن برابط مصدر. ثانياً، هناك مسألة السرعة: الوصول إلى الخدمات الخارجية يزيد من وقت الاستجابة، وهو أمر حاسم لوكلاء الذكاء الاصطناعي الذين يعملون في الوقت الفعلي. ثالثاً، ليست جميع المعلومات المهمة مفهرسة من قبل محركات البحث — البيانات الداخلية للشركات والتقارير المغلقة والتغييرات الداخلية قد تبقى غير مرئية للبحث لأسابيع.

هناك أيضاً معضلة معمارية أعمق. يجب على المطورين الموازنة بين المعرفة المدمجة في النموذج أثناء التدريب والمعلومات التي تم الحصول عليها في الوقت الفعلي. عندما تتعارض هاتان المصدران، يجب أن يكون النظام قادراً على تحديد أي منهما يجب أن يثق به. هذه مهمة غير تافهة تتطلب ليس فقط حلولاً تقنية، بل تطوير مبادئ جديدة لتصميم أنظمة الذكاء الاصطناعي. بشكل أساسي، تتجه الصناعة نحو بنية هجينة حيث يتم تعزيز المعرفة الثابتة للنموذج بتدفقات البيانات الديناميكية، وتعمل طبقة التحقق والأولويات بينهما.

بالنسبة للسوق الروسية، تتمتع هذه المشكلة بأبعاد إضافية. تم فهرسة القطاع الناطق بالروسية من الإنترنت بشكل أقل اكتمالاً من قبل محركات البحث الدولية، مما يعني أن البحث الحي مع التثبيت للاستعلامات باللغة الروسية قد يعمل مع فجوات ملحوظة. تجد الشركات التي تطور حلول الذكاء الاصطناعي المحلية — من Yandex إلى Sber — نفسها في موقف تحتاج فيه إلى بناء آليات خاصة بها لربط البيانات الحالية، معتمدة على فهارس البحث المحلية وقواعد المعرفة.

مشكلة البيانات القديمة في نماذج اللغة ليست خطأً يمكن إصلاحه بالتحديث التالي. إنها قيود معمارية أساسية تتطلب إعادة تفكير منهجية في كيفية تفاعل أنظمة الذكاء الاصطناعي مع المعلومات. البحث الحي مع التثبيت هي خطوة مهمة في الاتجاه الصحيح، لكن الحل الكامل لا يزال بعيداً. في الوقت الحالي، يجب على كل من يستخدم وكلاء الذكاء الاصطناعي لاتخاذ القرارات أن يتذكر: قد يبدو النموذج واثقاً تماماً، ويروي الأمس باعتباره اليوم.

ZK
Hamidun News
أخبار الذكاء الاصطناعي بدون ضوضاء. اختيار تحريري يومي من أكثر من 400 مصدر. منتج من جمال حميدون، رئيس الذكاء الاصطناعي في Alpina Digital.

هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟

AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.

ما رأيك؟
جارٍ تحميل التعليقات…