Habr AI→ المصدر

لماذا أصبح ChatGPT وLLM الأخرى أقوى بكثير من مجرد "التنبؤ بالكلمة"

لا تزال LLM تتنبأ بالتوكن التالي، لكن التحسينات الأساسية في السنوات الأخيرة بُنيت فوق هذه الآلية. تعلّمت النماذج أن تقول "لا أعرف"، وأن تستدعي أدوات خارجية،…

معالج بواسطة الذكاء الاصطناعي من Habr AI؛ بتحرير Hamidun News
لماذا أصبح ChatGPT وLLM الأخرى أقوى بكثير من مجرد "التنبؤ بالكلمة"
المصدر: Habr AI. كولاج: Hamidun News.
◐ استمع للمقال

نماذج اللغة الكبيرة لا تزال تبني إجابتها على أساس التنبؤ بالرمز التالي، لكن هذه الآلية البسيطة ظاهرياً أثبتت أنها أكثر إنتاجية بكثير مما توقعه حتى العديد من الباحثين. يُفسَّر النمو الحاد في جودة نماذج اللغة الكبيرة ليس فقط بالحجم، بل بكيفية إضافة النقد الذاتي والأدوات والتفكير المتعدد الخطوات فوق النموذج الأساسي.

من أين جاء التشكك

حتى في عام 2024، كان التفسير الشائع يبدو كالتالي: نماذج اللغة الكبيرة هي مكملات نصية عملاقة لا تفهم المعنى، بل تقتصر على متابعة تسلسلات الرموز. من هذا، نتجت استنتاجات مباشرة: إذا كانت القاعدة بدائية جداً، فإن سقف الجودة لمثل هذه الأنظمة يجب أن يكون منخفضاً. الهلوسات والإجابات النمطية والأداء السيء في المهام التي تتطلب بيانات طازجة لم تفعل سوى تعزيز هذه الرؤية.

مثال نموذجي - سؤال بتفاصيل محددة من العالم الحقيقي، مثل ما إذا كان من الأرخص الطيران من لندن إلى برشلونة أم ركوب القطار يوم الجمعة القادم. أجابت النماذج المبكرة بتعميمات: الطائرات عادة ما تكون أسرع وأرخص، القطارات أكثر راحة وبيئياً. قد تبدو مثل هذه الإجابة معقولة، لكنها لم تساعد في اتخاذ قرار.

لهذا السبب بدا للكثيرين أن القياس وحده لم يكن كافياً: ما كان مطلوباً ليس مكملاً نصياً أكبر، بل مستوى مختلف من السلوك.

ما الذي تمت إضافته فوق

كانت الطبقة الأولى المهمة فوق النموذج الأساسي هي القدرة على التعرف على عدم اليقين الخاص به. بدلاً من الإجابات الواثقة، يمكن لنماذج اللغة الكبيرة الحديثة بشكل متزايد أن تقول أنها لا تملك إمكانية الوصول إلى البيانات في الوقت الفعلي، أو تفتقر السياق، أو من الأفضل استشارة مصدر خارجي. قد يبدو هذا تحسناً سطحياً، لكنه في الواقع يزيد الفائدة بشكل حاد: يتوقف النموذج عن إخفاء ثغرات المعرفة ويبدأ في تحديد حدود كفاءته بشكل صحيح.

الطبقة الثانية هي استدعاء الأدوات. من وجهة نظر معمارية، لا يزال النموذج ينتج الرموز، لكن الآن تفسر البيئة رموزاً معينة كأوامر: إجراء بحث ويب، استدعاء API، الوصول إلى قاعدة بيانات أو تشغيل نص برمجي صغير. نتيجة لذلك، لا تحتاج نماذج اللغة الكبيرة إلى تذكر كل شيء داخل أوزانها: يمكنها الحصول على الحقائق الناقصة مباشرة أثناء توليد الإجابة والمتابعة بناءً عليها.

  • التحقق من الأسعار الحالية والطقس أو الجداول الزمنية عبر البحث على الويب
  • الوصول إلى قواعس المعرفة الشركة أو واجهات برمجة التطبيقات الخارجية
  • تشغيل نصوص Python للحسابات والمقارنات
  • إعادة محاولة الاستعلامات إذا بدت النتائج الأولية قديمة أو متناقضة

لماذا كان ناجحاً

لكن القفزة الأكثر غير متوقعة في الجودة لم تأتِ فقط من الأدوات، بل من تدريب التفكير. في البداية، بدا وكأنه استدعاء على غرار "فكر خطوة بخطوة"، مما ساعد النموذج على تحليل المهام بعناية أكبر. ثم دخل التعلم المعزز في الصورة، وفيما بعد - طرق مع مكافآت قابلة للتحقق، حيث يمكن التحقق من صحة إجابة الرياضيات أو الكود تلقائياً. بدأ النموذج لا يقتصر على تقديم الإجابات، بل يختار كل مرة بشكل متزايد المسارات التي تؤدي فعلاً إلى حلول صحيحة.

"التعلم المعزز يستهدف دائماً النتيجة. في هذه الحالة، كانت النتيجة هي التفكير."

من هنا نمت فكرة أخرى: إذا كان النموذج يعرف بالفعل كيف يفكر خطوة بخطوة، يمكن إعطاؤه المزيد من الوقت للتفكير. الرموز الإضافية أثناء توليد الإجابة لا تصبح ثرثرة فارغة، بل استكشاف البدائل والفحص الذاتي والتراجع عن الفرضيات الفاشلة. بشكل أساسي، يتم تحديد جزء من الذكاء الآن ليس فقط بما تم حفظه أثناء التدريب، بل بمقدار الحسابات التي ينفقها النظام وقت الاستعلام.

إنها بالفعل مزيج التفكير والأدوات ما يجعل نماذج اللغة الكبيرة الحديثة أقوى بكثير من الإصدارات السابقة. في مهمة القطار والطائرة، يفهم النموذج الجيد أولاً البيانات الناقصة لديه، ثم يبحث عن الأسعار، يقارن الاتصالات ومدة المسار، يحسب النتائج من خلال الكود إذا لزم الأمر، ثم يتحقق من عدم تقادم النتائج. هذا لم يعد مجرد رد نصي جميل، بل حلقة عمل فعالة لاتخاذ القرار مبنية على نفس آلية التنبؤ بالرمز التالي.

ماذا يعني هذا

يُفسَّر نجاح نماذج اللغة الكبيرة الآن ليس بالسحر وليس بالقياس وحده، بل بالهندسة المعمارية الموضوعة فوق مبدأ أساسي. يمكن للنماذج أن تخطئ، وتعلق في حلقات، وتهلوس، لكن مزيج النقد الذاتي والأدوات والتفكير المعزز حول التعلم يحول "إكمال النص" إلى نظام يساعد فعلاً في حل المشاكل العملية.

ZK
Hamidun News
أخبار الذكاء الاصطناعي بدون ضوضاء. اختيار تحريري يومي من أكثر من 400 مصدر. منتج من جمال حميدون، رئيس الذكاء الاصطناعي في Alpina Digital.

هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟

AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.

ما رأيك؟
جارٍ تحميل التعليقات…