Futurism→ المصدر

انهيار وكلاء الذكاء الاصطناعي: أثبتت الرياضيات أنهم لن يصبحوا موثوقين أبداً

هل تتذكر كيف توقف الجميع فجأة عن الحديث عن برامج الدردشة الآلية في العام الماضي وبدأوا يحلمون بـ "الوكلاء"؟ وُعدنا بأن الذكاء الاصطناعي سيقوم قريباً بحجز…

معالج بواسطة الذكاء الاصطناعي من Futurism؛ بتحرير Hamidun News
انهيار وكلاء الذكاء الاصطناعي: أثبتت الرياضيات أنهم لن يصبحوا موثوقين أبداً
المصدر: Futurism. كولاج: Hamidun News.
◐ استمع للمقال

هل تتذكر كيف توقف الجميع فجأة عن الحديث عن برامج الدردشة الآلية في العام الماضي وبدأوا يحلمون بـ "الوكلاء"؟ وُعدنا بأن الذكاء الاصطناعي سيقوم قريباً بحجز التذاكر بمفرده، وكتابة الأكواد لأقسام كاملة، وإدارة سلاسل التوريد بينما نحتسي العصائر المخفوقة. اتضح أن الرياضيات لها رأي مختلف في الموضوع، ورأي غير سار لمن أعادوا بالفعل كتابة خططهم التجارية حول "الاستقلالية الكاملة".

نشرت مجموعة من الباحثين عملاً يضرب الألم الأشد في الصناعة: الاستحالة الرياضية لوكلاء الذكاء الاصطناعي المستقلين الموثوقين. المشكلة ليست أن النماذج "غبية" أو تفتقر إلى بيانات التدريب من Reddit. تكمن المشكلة في البنية الأساسية للمهام المتسلسلة. إذا طلبت من الذكاء الاصطناعي القيام بشيء ما في خطوة واحدة، فإن احتمال النجاح مرتفع. لكن بمجرد أن تسلسل عشر إجراءات، يبدأ الرعب الرحيم لنظرية الاحتمالات.

تخيل أن كل خطوة يتخذها الوكيل تُنفذ بدقة 95%. يبدو جيداً إلى حد ما، أليس كذلك؟ في عالم الإنسان، هذا هو مستوى الطالب المتفوق. لكن في سلسلة من عشر خطوات، ينخفض احتمال النجاح الإجمالي إلى ما دون 60%. وإذا كان هناك مائة خطوة؟ فإن احتمال وصول الوكيل إلى النهاية دون تحويل مشروعك إلى قمامة رقمية يقترب من الصفر. يُطلق على هذا "التراكم الكارثي للأخطاء"، ويبدو أنه لا يمكن علاجه ببساطة عن طريق زيادة نافذة السياق أو إضافة مجموعة أخرى من بطاقات الرسومات H100.

تجد الصناعة نفسها الآن في موقف غريب جداً. من جهة—رأسماليون مغامرون يسكبون مليارات الدولارات في شركات ناشئة مثل Cognition، يعدون بـ "أول مهندس ذكاء اصطناعي في العالم". من جهة أخرى—الرياضيات الصرفة التي تقول: "يا رفاق، هذا لن ينجح بالطريقة التي ترسمونها في عروضكم التقديمية". نحن نحاول بناء ناطحة سحاب على مستنقع، على أمل أنه إذا جعلنا الواجهة أجمل، ستقوي الأساس نفسها.

الشيء الأكثر سخرية هنا هو أن الشركات تستمر في بيع "الاستقلالية" كميزة رئيسية. لكن في الواقع، نحصل على أنظمة تتطلب إشرافاً مستمراً. هذا ليس تحرراً من الروتين، بل شكل جديد من الإشراف حيث يصبح البشر مصححين أبديين لخوارزمية شبه مجنونة. إذا أخطأ الوكيل في 5% من الحالات، لكنه يفعل ذلك بصمت وبثقة مطلقة في صحته، فإنه يصبح أخطر من أكسل موظف كسول وغير كفء. يمكن التنبؤ بخطأ الإنسان؛ لا يمكن التنبؤ بخطأ النموذج الإحصائي.

اعتدنا أن نعجب بكيفية كتابة الشبكات العصبية للقصائد أو شرح الفيزياء الكمية. كان ممتعاً، لكنه عملياً عديم الفائدة للإنتاج الحقيقي. ثم جاءت عصر الوكلاء. كانت الفكرة بسيطة: امنح النموذج أدوات—متصفح ويب، طرفية، إمكانية الوصول إلى API—واسمح له بالعمل. لقد حول هذا الذكاء الاصطناعي من "ببغاء ذكي" إلى "متدرب رقمي". لكن كما اتضح، يعاني هذا المتدرب من شكل حاد وتصاعدي من عدم الانتباه، مرسخ فيه على مستوى الصيغ.

ماذا يعني هذا بالنسبة لنا في الأجل القريب؟ على الأرجح، يتم تأجيل عصر "اضغط على الزر—احصل على النتيجة" إلى أجل غير مسمى. سيتعين علينا إعادة النظر في نهجنا لهندسة الذكاء الاصطناعي: الانتقال من الاستقلالية الكاملة إلى وحدات خاضعة للرقابة الصارمة، حيث يتم التحقق من كل خطوة ليس من قبل ذكاء اصطناعي آخر، بل من خلال الأساليب الرسمية أو إنسان حي. لا يمكن خداع الرياضيات بعروض توضيحية براقة على X (تويتر سابقاً). يمر الطريق نحو ذكاء حقيقي قادر على أفعال موثوقة عبر فهم العلاقات السببية، وليس مجرد التخمين للرمز التالي.

الخلاصة: وكلاء الذكاء الاصطناعي بصيغتهم الحالية هي فخ إحصائي. إلى أن نحل مشكلة تراكم الأخطاء، ستبقى "الاستقلالية" مجرد جاذبية مكلفة وغير موثوقة للمستثمرين. هل ننتظر حتى يتصادم الضجيج الإعلامي أخيراً مع الواقع؟

ZK
Hamidun News
أخبار الذكاء الاصطناعي بدون ضوضاء. اختيار تحريري يومي من أكثر من 400 مصدر. منتج من جمال حميدون، رئيس الذكاء الاصطناعي في Alpina Digital.

هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟

AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.

ما رأيك؟
جارٍ تحميل التعليقات…