IEEE Spectrum AI→ المصدر

حدود جديدة للذكاء الاصطناعي: من البيانات إلى تجربة التفاعل

في العقد الماضي، تم قياس التقدم في مجال الذكاء الاصطناعي بالحجم: نماذج أكبر ومجموعات بيانات أكبر وقوة حوسبة أكثر. أدى هذا النهج إلى اختراقات مذهلة في نماذج…

معالج بواسطة الذكاء الاصطناعي من IEEE Spectrum AI؛ بتحرير Hamidun News
حدود جديدة للذكاء الاصطناعي: من البيانات إلى تجربة التفاعل
المصدر: IEEE Spectrum AI. كولاج: Hamidun News.
◐ استمع للمقال

في العقد الماضي، تم قياس التقدم في مجال الذكاء الاصطناعي بالحجم: نماذج أكبر ومجموعات بيانات أكبر وقوة حوسبة أكثر. أدى هذا النهج إلى اختراقات مذهلة في نماذج اللغة الكبيرة (LLMs). في خمس سنوات فقط، حققت الذكاء الاصطناعي قفزة من نماذج مثل GPT-2، التي بالكاد تستطيع تقليد الترابط، إلى أنظمة مثل GPT-4، التي يمكنها التفكير والمشاركة في حوار ذو مغزى. والآن، تشير الأنماط الأولية لوكلاء الذكاء الاصطناعي التي يمكنها التنقل في قواعد البيانات أو تصفح صفحات الويب إلى حدود جديدة تماماً.

لكن الحجم وحده لا يمكن أن يأخذ الذكاء الاصطناعي بعيداً جداً. القفزة القادمة لن تأتي من مجرد زيادة حجم النماذج. ستأتي من الجمع بين البيانات عالية الجودة بشكل متزايد مع العوالم التي نبنيها لتدريب النماذج. والسؤال الأكثر أهمية يصبح: كيف تبدو الفصول الدراسية للذكاء الاصطناعي؟

خلال الأشهر القليلة الماضية، وضعت وادي السيليكون رهاناتها، والمختبرات تستثمر مليارات في بناء مثل هذه الفصول الدراسية، التي تسمى بيئات التعلم بالتعزيز (RL). تسمح هذه البيئات للآلات بالتجريب والفشل والتحسن في مساحات رقمية واقعية.

تطورت قصة الذكاء الاصطناعي الحديث عبر حقب، كل منها محددة بنوع البيانات التي استهلكتها النماذج. جاءت أولاً حقبة التدريب المسبق على مجموعات بيانات بحجم الإنترنت. سمحت هذه البيانات العامة للآلات بتقليد اللغة البشرية من خلال التعرف على الأنماط الإحصائية. ثم جاءت البيانات مقترنة بالتعلم بالتعزيز من تعليقات الإنسان — طريقة تستخدم العمال بالعمل الجماعي لتقييم ردود LLM — مما جعل الذكاء الاصطناعي أكثر فائدة واستجابة ومتوافقة مع تفضيلات الإنسان.

اليوم، تبقى البيانات الأساس. هي المادة الخام التي يتم بناء الذكاء منها. لكننا نحدث حقبة جديدة حيث البيانات وحدها لم تعد كافية. لفتح الحدود القادمة، يجب أن نجمع بين البيانات عالية الجودة والبيئات التي تسمح بالتفاعل غير المحدود والتعليقات المستمرة والتعلم من خلال العمل. بيئات RL لا تحل محل البيانات؛ بل تعزز ما يمكن للبيانات أن تفعله من خلال السماح للنماذج بتطبيق المعرفة واختبار الفرضيات وتحسين السلوك في ظروف واقعية.

في بيئة RL، يتعلم النموذج من خلال حلقة بسيطة: يلاحظ حالة العالم، ويتخذ إجراءً، ويتلقى مكافأة تشير إلى ما إذا كان هذا الإجراء قد ساعد في تحقيق الهدف. على مدار عدة تكرارات، يكتشف النموذج تدريجياً الاستراتيجيات التي تؤدي إلى نتائج أفضل. التحول الحاسم هو أن التعلم يصبح تفاعلياً — لا تتنبأ النماذج فقط بالعلامة التالية، بل تتحسن من خلال المحاولة والخطأ والتعليقات.

على سبيل المثال، يمكن لنماذج اللغة بالفعل توليد الكود في إعداد دردشة بسيطة. ضعها في بيئة ترميز حية حيث يمكنها الحصول على السياق وتشغيل الكود الخاص بها وتصحيح الأخطاء وتحسين الحل الخاص بها، وشيء ما يتغير. يتحركون من النصح إلى حل المشاكل المستقل.

في عالم يحركه البرنامج، ستكون قدرة الذكاء الاصطناعي على إنشاء واختبار كود على مستوى الإنتاج في المستودعات الضخمة تغييراً جدياً في القدرات. هذه القفزة لن تحدث فقط من خلال توسيع مجموعات البيانات؛ ستحدث بسبب البيئات الانغمارية حيث يمكن للوكلاء التجريب والتعثر والتعلم من خلال التكرار — تماماً كما يفعل المبرمجون البشريون. العالم الحقيقي للتطوير فوضوي: يجب على المبرمجين التعامل مع الأخطاء غير المحددة جيداً وقواعد البيانات المتشابكة والمتطلبات غامضة.

تدريب الذكاء الاصطناعي على التعامل مع هذا الفوضى هو الطريقة الوحيدة التي يمكن بها أن ينتقل من إنتاج محاولات عرضة للخطأ إلى إنشاء حلول متسقة وموثوقة.

التنقل في الويب أيضاً فوضوي. النوافذ المنبثقة وجدران تسجيل الدخول والروابط المكسورة والمعلومات القديمة محبوكة في سير العمل اليومي للتصفح. يتعامل البشر مع هذه الأعطال تقريباً بغريزية، لكن الذكاء الاصطناعي لا يمكنه فقط تطوير هذه القدرة من خلال التدريب في البيئات التي تحاكي عدم القدرة على التنبؤ بالإنترنت. يحتاج الوكلاء إلى التعلم للتعافي من الأخطاء والتعرف على عقبات الواجهة وتجاوزها وتنفيذ سير عمل متعدد الخطوات في التطبيقات المستخدمة على نطاق واسع.

لقد اعتمد كل قفزة كبيرة في تطور الذكاء الاصطناعي على البنية التحتية غير المرئية، مثل الشروح الذين يصنفون مجموعات البيانات والباحثين الذين يدربون نماذج المكافأة والمهندسين الذين يبنون السقالات لاستخدام LLMs الأدوات والإجراءات. كان العثور على أحجام كبيرة من مجموعات البيانات عالية الجودة ذات مرة اختناقاً في الذكاء الاصطناعي، وحل المشكلة أثار الموجة السابقة من التقدم. اليوم، الاختناق ليس البيانات — بل إنشاء بيئات RL التي تكون غنية وواقعية ومفيدة حقاً.

المرحلة التالية من تقدم الذكاء الاصطناعي لن تكون مسألة حظ الحجم. ستكون نتيجة الجمع بين أساس قوي من البيانات مع البيئات التفاعلية التي تعلم الآلات التصرف والتكيف والتفكير في السيناريوهات المعقدة من العالم الحقيقي. ستحول الصناديق الرملية للترميز وملاعب نظام التشغيل والمتصفح والمحاكاة الآمنة التنبؤ إلى الكفاءة.

ZK
Hamidun News
أخبار الذكاء الاصطناعي بدون ضوضاء. اختيار تحريري يومي من أكثر من 400 مصدر. منتج من جمال حميدون، رئيس الذكاء الاصطناعي في Alpina Digital.

هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟

AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.

ما رأيك؟
جارٍ تحميل التعليقات…