Habr AI→ المصدر

هابر إيه آي يشرح لماذا نماذج اللغة الكبيرة لا تحسب ولا تتعلم في الحوار وتعتمد على الأدوات

يفند هابر إيه آي أسطورتين رئيسيتين عن نماذج اللغة الكبيرة: أنها لا تتعلم مباشرة في المحادثة ولا تستطيع 'فعل كل شيء بمفردها'. نموذج اللغة قوي في معالجة…

معالج بواسطة الذكاء الاصطناعي من Habr AI؛ بتحرير Hamidun News
هابر إيه آي يشرح لماذا نماذج اللغة الكبيرة لا تحسب ولا تتعلم في الحوار وتعتمد على الأدوات
المصدر: Habr AI. كولاج: Hamidun News.
◐ استمع للمقال

يقدم مقال على Habr AI تفنيداً للأسطورة الشائعة بأن روبوت الدردشة الحديث هو بالفعل بذاته ذكاء عام شامل. الأطروحة الرئيسية للمؤلف بسيطة: نموذج اللغة الأساسي بطبيعته يستطيع فقط العمل مع النصوص - قبول طلب نصي وإنشاء رد نصي. كل شيء آخر يدركه المستخدم على أنه "قدرات سحرية" للنموذج يتم توفيره عادة بواسطة أدوات خارجية وتكاملات وتنسيق. لهذا السبب يمكن للواجهات نفسها أن ترسم الصور وتبحث على الإنترنت وتحسب الأرقام، بينما النموذج اللغوي نفسه لا يصبح فناناً أو محرك بحث أو آلة حاسبة من خلال هذا.

الاعتقاد الخاطئ الأول يتعلق بالشعور بأن نموذج اللغة الكبير "يستطيع فعل كل شيء". إذا طلبت منه إنشاء صورة، فإنه يصيغ طلباً لنموذج توليد منفصل. إذا تحدثت معه بالصوت، فإن التعرف على الكلام وتركيب الكلام يشاركان في السلسلة. إذا كنت بحاجة إلى حساب دقيق، فإن النتائج الموثوقة تظهر عادة فقط بعد استدعاء مترجم الأكواد أو أداة حسابية أخرى. بدون هذه الطبقات الإضافية، يعتمد نموذج اللغة الكبير على الإعادة الاحتمالية لأنماط التدريب: يمكنه حل مثال بسيط بشكل صحيح، لكنه يخطئ بسهولة في الأرقام الطويلة والصيغ والمهام التي تتطلب دقة عالية. من هذا يتبع حد عملي مهم: قوة النموذج ليست الرياضيات كما هي، بل الوصف النصي للمهمة واختيار الأداة المناسبة.

الأسطورة الثانية هي أن النموذج يتعلم أثناء المحادثة. يذكرنا المؤلف بأن الاستدلال والتعلم عمليتان مختلفتان. عندما يكتب المستخدم طلباً، ينشئ النموذج بشكل متتالي الرموز بناءً على أوزان محددة بالفعل، والأوزان نفسها لا تتغير في تلك اللحظة. هذا يعني أن نموذج لغة محدداً في جلسة محددة لا "يتذكر درساً" ولا يصبح أكثر ذكاءً من ملاحظة المستخدم. نعم، يمكن للمزودين لاحقاً استخدام الحوارات المجهولة لتدريب النسخ المستقبلية، لكن هذا بالفعل دورة ضبط دقيق منفصلة، وليس تحديثاً سحرياً في الدردشة. من هذا أيضاً يتبع استنتاج آخر: الذاكرة المتعلقة بالمستخدم بين الحوارات عادة ليست تدريب النموذج، بل السياق المحفوظ الذي يتم مزجه مجدداً في الطلب.

تشرح المقالة بعد ذلك بإيجاز مما يتكون نموذج اللغة الكبير العام. في جوهره يوجد محول يرى كل السياق المتاح دفعة واحدة وينشئ رداً كسلسلة من الرموز المحتملة، مع الحفاظ على الاتساق الكلي للنص من خلال الأنماط المتعلمة. فوق هذا يعمل RLHF - الضبط لصيغة المساعد والأدب واتباع التعليمات وقيود السلامة. لكن RLHF لا يحول النموذج إلى آلة منطقية ولا يصلح الضعف الأساسي. لذلك، نماذج اللغة جيدة في تحليل النص والتلخيص وتغيير الأسلوب والتعليمات خطوة بخطوة والعمل مع التنسيقات مثل JSON واختيار الأدوات. وهي ضعيفة في الحسابات الدقيقة ومعالجة الجداول الكبيرة واحتفاظ كميات ضخمة من البيانات في السياق ومعرفة الحالة الحالية للعالم بعد تاريخ التدريب. إلى هذا أضف الطبيعة الاحتمالية للرد والحساسية لصياغة الطلب والخطر من الهلوسة.

لجعل نموذج اللغة الكبير مفيداً في الإنتاج، يتم بناء طبقة إضافية حوله. للمعرفة الثابتة، يُستخدم RAG: يتم تقسيم المستندات إلى أجزاء، يتم البحث عن القطع القريبة دلالياً حسب الطلب، والنموذج يتلقى فقط السياق ذا الصلة. بالنسبة للبيانات الديناميكية والإجراءات، يتم تطبيق استدعاء الوظيفة: يقرر نموذج اللغة الكبير متى يستدعي واجهة برمجية أو قاعدة بيانات أو آلة حاسبة أو محاكاة، والمنسق يتحقق من الاستدعاءات ويضيف ردود الأدوات إلى السجل ويدير الدورة كاملة. نفس المنسق يتولى ذاكرة الحوار والطلبات الموجهة للنظام والتحقق من صيغة الإخراج وإطلاق الوكلاء الفرعيين.

على هذا الأساس تظهر مفاهيم أكثر طموحاً - وكلاء ذكاء اصطناعي وموظفون رقميون وكوبايلوتس والتوائم الرقمية. في الأساس، هذا ليس سحراً منفصلاً، بل مزيج من نماذج اللغة الكبيرة وقواعس المعرفة وواجهات برمجية وأتمتة ومحركات الحسابات الكلاسيكية. هذا يعني أن مناقشة "الذكاء الاصطناعي" دون تمييز التقنيات لم تعد كافية.

إذا كانت الشركة بحاجة إلى حسابات دقيقة أو أتمتة صارمة أو توقعات على بيانات منظمة، فإن نموذج اللغة الكبير وحده ليس كافياً. إذا كان العمل مع رسائل البريد والمستندات والتعليمات والبحث عن المعرفة وواجهة الحوار لنظام معقد ضروريّاً، فإن نموذج اللغة الكبير يعطي بالفعل دفعة قوية. المنظور الرصين من المقالة مفيد بالضبط لأنه يزيل التوقعات الزائدة: لا حاجة لنسب قدرات خارقة إلى نموذج اللغة، لكن من الخطأ أيضاً نقلل من شأنه كواجهة ومنسق الأدوات الأخرى.

ZK
Hamidun News
أخبار الذكاء الاصطناعي بدون ضوضاء. اختيار تحريري يومي من أكثر من 400 مصدر. منتج من جمال حميدون، رئيس الذكاء الاصطناعي في Alpina Digital.

هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟

AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.

ما رأيك؟
جارٍ تحميل التعليقات…