Centaur عرف الإجابات لكن لم يفهم الأسئلة: دراسة تطعن في 'تفكير' الذكاء الاصطناعي
أثار نموذج Centaur ضجة: ادعى أنه يحاكي التفكير البشري في 160 مهمة معرفية — من الذاكرة إلى اتخاذ القرارات. يكشف البحث الجديد عن هذا الاختراق: النموذج لم يكن…
معالج بواسطة الذكاء الاصطناعي من Science Daily AI؛ بتحرير Hamidun News
سنتور كان يعرف الإجابات، لكنه لم يفهم الأسئلة: البحث ينقض «التفكير» الاصطناعي
ادّعى نموذج سنتور بأنه إحراز طفرة: الذكاء الاصطناعي اكتسب ما يبدو أنه القدرة على محاكاة التفكير البشري في 160 مهمة معرفية في نفس الوقت — من الذاكرة إلى اتخاذ القرارات. بحث جديد ينقض هذا الادعاء: لم يكن النموذج يفكر، بل كان يحفظ الأنماط.
النقاش القديم، لاعب جديد
السؤال عن طبيعة التفكير البشري هو أحد أطول الأسئلة في علم النفس. هل التفكير نظام موحد له «محرك» مشترك، أم أنه مجموعة من الوحدات المتخصصة، كل منها مسؤولة عن مجالها الخاص: الذاكرة والانتباه واللغة والملاحة المكانية واتخاذ القرارات؟ هذا ليس لعبة كلمات أكاديمية. الإجابة تحدد كيفية تصميم اختبارات القدرات المعرفية وعلاج الاضطرابات مثل الخرف أو عسر القراءة وتصميم أنظمة الذكاء الاصطناعي التي تدّعي «الفهم».
بعد عقود من النقاش، لم يظهر إجماع واحد. ظهر سنتور كإجابة محتملة من اتجاه غير متوقع. الفكرة: تدريب نموذج ذكاء اصطناعي على بيانات السلوك البشري في الاختبارات المعرفية، ثم الملاحظة — إذا كان النموذج يعيد إنتاج نفس السلوك، فإنه قد «التقط» بنية التفكير.
ادّعى المؤلفون أن سنتور يؤدي 160 مهمة معرفية مختلفة بدقة مماثلة للبشر. نطاق الادعاء كان نادراً: لم يدّع أي نموذج سابق مثل هذا النطاق المعرفي.
حيث ينهار الحجة
اكتشف الباحثون الذين تحققوا بشكل مستقل من عمل سنتور مشكلة أساسية: النتائج العالية تُفسّر ليس بـ «الفهم»، بل بالحفظ. ثغرات منهجية محددة:
- تداخل البيانات: تتداخل مجموعة التدريب مع مجموعة الاختبار — النموذج في الواقع «رأى» الإجابات الصحيحة قبل التقييم
- لا نقل للمعرفة: في المهام غير المعروفة بنفس البنية، لم يظهر النموذج نتائج متسقة
- نمط بدون آلية: التوافق العالي مع الإجابات البشرية لا يعني إعادة إنتاج العمليات المعرفية — فقط شكلها الخارجي
- التحقق الضعيف: لم يجرِ المؤلفون اختبارات على مهام معدّلة خصيصاً حيث لن تعمل الإجابات المحفوظة
بحسب النقاد، هذه حالة كلاسيكية: النموذج كان يعرف ماذا يجيب دون فهم السؤال.
لماذا هذا مهم
ادعاء سنتور لم يكن علمياً فحسب — كان وسيلياً. إذا كان الذكاء الاصطناعي يعيد بالفعل إنتاج العمليات المعرفية، فسيفتح طريقة جديدة لدراسة العقل: بدلاً من التجارب العصبية النفسية المكلفة، يمكن اختبار النظريات مباشرة على نماذج الذكاء الاصطناعي. هذا سيسرّع بشكل جذري علم النفس المعرفي. لكن الحدود بين «الحفظ» و«التفكير» في تقييم الذكاء الاصطناعي تبقى دون عبور. تظهر نماذج اللغة بانتظام نتائج عالية على المعايير — وعند الفحص التفصيلي، يتضح أن وراء ذلك إعادة إنتاج الأنماط من بيانات التدريب، وليس التعميم.
«النموذج كان يعرف ماذا يجيب — لكنه لا يعرف لماذا»، — هذا تقريباً كيف
يصيغ النقاد جوهر الاعتراض على سنتور.
القصة هنا ليست جديدة. في كل مرة يحقق فيها الذكاء الاصطناعي درجة عالية في «الفهم»، يتبعها فحص تفصيلي — ويتضح أن الاختبار كان يقيس شيئاً آخر. ينطبق سنتور على هذا النمط.
ما معنى هذا
المعيار المقنع والفهم الحقيقي أشياء مختلفة. حتى تظهر معايير تفصل بشكل أساسي بين حفظ الأنماط والتعميم المعرفي، ستبقى ادعاءات «الذكاء الاصطناعي الذي يفكر مثل الإنسان» محل تساؤل. بالنسبة لعلم النفس المعرفي، الخطوة التالية واضحة: تطوير اختبارات لا يمكن بحكم التعريف النجاح فيها من خلال الحفظ.
هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟
AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.