Habr AI: لماذا تبدو هلوسات LLM أقرب إلى خلل بشري منها إلى خلل رياضي
يُقترح النظر إلى هلوسات LLM ليس فقط كخلل رياضي، بل أيضًا كانعكاس لأخطاء مألوفة في التفكير البشري. وفي صلب النص مثال يتجاوز فيه الإنسان حدود مهمة بسيطة…
معالج بواسطة الذكاء الاصطناعي من Habr AI؛ بتحرير Hamidun News
في موقع Habr AI، نُشرت مقالة عمود بشأن الفكرة القائلة بأن هلوسات نماذج اللغة الكبيرة يجب أن تُعتبر ليس فقط كعيب هندسي، بل أيضاً كانعكاس لإخفاقات معرفية بشرية معروفة. يفحص المؤلف المسألة كما يفعل الطبيب السريري: بدلاً من الاستنكار، يقترح تحليل مكان فقدان النظام لحدود المهمة بالضبط ولماذا ينتج بثقة إجابة غير صحيحة.
لماذا يزعج هذا الجميع
عادة ما تكون ردة الفعل على هلوسات نماذج اللغة الكبيرة حادة جداً: يتوقع المستخدم أن يبقى النموذج ضمن السياق، لكنه بدلاً من ذلك يحصل على بيان واثق لكن غير صحيح. وردّاً على ذلك، احتمى المطورون لوقت طويل خلف التفسيرات الكلاسيكية مثل GIGO و RTFM، ثم بدأوا بتعزيز المنتجات من خلال RAG والقيود الإضافية. لكن الشكوى نفسها لم تختفِ أبداً: يتوقع الناس أن تتصرف الآلة مثل شريك محادثة "صحيح" لا يفقد خيط المحادثة ولا يختلق حقائق على عجل.
في المقالة، يُقلب هذا المنطق رأساً على عقب. يكتب المؤلف أن الأعطال الأولى للشبكة العصبية لم تفاجئه، لأنه في الممارسة السريرية، العمل مع اضطرابات التفكير هو جزء روتيني من المهنة. من هنا تأتي الأطروحة الرئيسية: ينشأ الضيق ليس فقط من الخطأ ذاته، بل من توقعات مبالغ فيها بأن الذكاء الاصطناعي يجب أن يفكر بطريقة أنظف وأكثر نظاماً من البشر.
- يتوقع المستخدم اتباع التعليمات حرفياً
- يذكّر المهندس بجودة بيانات الإدخال
- تضيف فرق المنتج RAG والمرشحات والفحوصات
- لكن النموذج لا يزال يرث أنماط الفشل المألوفة
خلل في الشبكة العصبية البروتينية
الجزء الأقوى من النص هو مثال يومي حيث يرتكب الشخص الخطأ، وليس النموذج. يعطي المؤلف مقدمة بسيطة: "وفقاً لجواز سفري، أنا أولجا. في البيت يناديني أليونا. اختر واحداً من الاثنين." شكلياً هناك خياران فقط، لكن "الشبكة العصبية البروتينية" غالباً ما تجيب: "أنت لينا." هكذا، برأي المؤلف، يبدو فشل هندسة المحفز البشري بالضبط في مهمة أولية. النقطة من المثال هي أن الدماغ لا يحب الاحتفاظ بقيود متناقضة لفترة طويلة. بدلاً من الاختيار الصارم من مجموعة معينة، ينتقل بسرعة إلى التجميعات: أليونا، إيلينا، لينا—ويستبدل إجابة إحصائياً مألوفة. لا ينشأ الخطأ من النية السيئة وليس من سوء فهم كامل للغة، بل من الرغبة في اختصار الطريق إلى نتيجة "معقولة". لذا فإن الشكوى "تتجاهل الشبكة العصبية السياق" بمعنى ما تعود أيضاً إلى البشر.
ما الذي ينكسر في الرأس
يصف المؤلف هذا الفشل بأنه انتهاك للقيود—انتهاك لمعاملات المهمة. إذا نظرنا إليه من خلال علم النفس، فإن الدماغ يتخلى عن المحفز الأصلي، ويسترجع الخيار الترابطي الأكثر ملاءمة، ويسلمه بثقة كاملة. من حيث الانحيازات المعرفية، يشبه هذا القفز إلى الاستنتاجات—قفزة نحو نتيجة دون التحقق الكافي من الشروط. بالنسبة للقارئ من صناعة الذكاء الاصطناعي، هذا يبدو مثل خلل مألوف في نماذج اللغة الكبيرة: كانت القيود موجودة، لكن النظام لم يحتفظ بها حتى نهاية التوليد.
"الذكاء الاصطناعي ليس معطلاً. ربما أعدنا إنتاج خللنا الخاص."
النتيجة العملية للمؤلف متواضعة بشكل مفاجئ. يتم إصلاح بعض هذه الأعطال ليس فقط من خلال حيل معمارية جديدة، بل من خلال انضباط التفاعل الصحيح. إذا كانت المهمة غير واضحة، من الأفيد توضيح الأمور بدلاً من التخمين. ينطبق هذا المنطق على الأشخاص والنماذج على حد سواء: كلما تم تحديد الحدود بشكل أفضل، قل احتمال انجراف الإجابة نحو ارتجال واثق. وهذا بالضبط لماذا لا يمكن اختزال الجدل حول الهلوسات إلى السؤال وحده "هل لدى النظام بيانات كافية؟"
ماذا يعني هذا
تكون المقالة مفيدة بأنها تزيل الدراما غير الضرورية من الموضوع. تبقى هلوسات نماذج اللغة الكبيرة مشكلة جادة في المنتج، لكن المنظور السريري يظهر: قد تكون جزء من طبيعتها أقرب إلى الاختصارات المعرفية البشرية منها إلى "جنون الآلة الغامض". بالنسبة للمطورين، هذا حجة ليس فقط لتحسين النماذج والاسترجاع، بل لتصميم واجهات حيث يكون من الأسهل على النظام توضيح الطلب بدلاً من الفشل بثقة. بالنسبة للمستخدمين—تذكير بأن النبرة الواثقة ليست نفس الفهم.
هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟
AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.