نماذج العالم: كيف يتعلم الذكاء الاصطناعي فهم الواقع الفيزيائي بدلاً من النصوص
عقدت جامعة MIT نقاشاً حول نماذج العالم (World Models)، وهي اتجاه جديد قد يمثل النقلة الكبيرة التالية في تطور الذكاء الاصطناعي. تعمل الشركات على تطوير أنظمة…
معالج بواسطة الذكاء الاصطناعي من MIT Technology Review؛ بتحرير Hamidun News
ناقشت مؤتمر MIT Technology Review في مايو موضوع نماذج العالم (World Models) — وهو ما قد يصبح القفزة الكبيرة التالية في تطور الذكاء الاصطناعي. قام رئيس التحرير مات هونان والمحرر الأول للذكاء الاصطناعي ويل دوغلاس هيفن بتحليل كيفية محاولات الشركات تعليم الشبكات العصبية ليس فقط معالجة النصوص، بل فهم الواقع المحيط بشكل حقيقي.
ما هي نماذج العالم
نموذج العالم ليس نسخة أخرى من نموذج لغة كبير (LLM). إنه نظام مختلف بشكل جذري، يمكنه مشاهدة مقاطع الفيديو وتحليل الصور والتفاعل مع البيئة المحيطة والتنبؤ بعواقب الإجراءات. مثل شخص يرى كتلة على حافة الطاولة ويفهم أنها ستسقط. يجب على الشبكة العصبية اكتساب هذا الفهم دون تعليمات صريحة، وتعلمها من خلال مراقبة العالم الفيزيائي.
تغير هذه النماذج نموذج التعلم. بدلاً من النمط الكلاسيكي «إليك نصاً، أجب على السؤال» يظهر نمط جديد: «شاهد الفيديو، توقع ما سيحدث بعد ذلك». وهذا يتطلب معمارية مختلفة تماماً، ومجموعة بيانات مختلفة، وطريقة مختلفة لتقييم أخطاء النموذج.
لماذا النصوص غير كافية بوضوح
نماذج اللغة الكبيرة الحديثة هي أبطال معالجة المعلومات، لكنها عمياء بالمعنى الحرفي للكلمة. تعرف عن الجاذبية فقط لأن الناس كتبوا عنها ملايين المرات على الإنترنت. لكنها لم ترَ أبداً جسماً يسقط، ولم تشعر بالقصور الذاتي، ولم تجرب الفيزياء.
وهذا يخلق نقاط عمياء محددة:
- لا يمكنها التنبؤ بالتفاعلات الفيزيائية من المبادئ الأساسية
- تتشوش في العلاقات المكانية بين الكائنات في الفيديو
- غير قادرة على فهم العلاقات السببية في سلسلة الإطارات
- غير قادرة على التخطيط للإجراءات بناءً على الفيزياء الحقيقية
- تخطئ في التنبؤ بالمسارات والاصطدامات
هذا التحديد ملحوظ بشكل خاص عندما يحاول الذكاء الاصطناعي التحكم في الروبوت أو التخطيط للخدمات اللوجستية أو التنبؤ بعواقب التلاعب في الواقع.
من يعمل على نماذج العالم
تستثمر OpenAI وDeepMind وTesla وشركات كبيرة أخرى موارد بنشاط في تطوير نماذج العالم. تختلف النهج المتبعة. تعمل OpenAI وDeepMind على مجموعات بيانات الفيديو من YouTube والمحاكاة الاصطناعية. تستخدم Tesla ملايين ساعات الفيديو من كاميرات سيارتها لتعليم النظام الرؤية بنفس الطريقة التي يرى بها الناس الطريق.
تبدأ بعض الشركات بالتعلم الموجه على مقاطع فيديو موسومة. يستخدم آخرون التعلم المعزز في المحاكاة المسيطرة، حيث يمكن للنموذج الخطأ مليون مرة دون عواقب حقيقية، ويحسن فهمه تدريجياً.
ماذا يعني هذا
إذا تمكنت الشركات من توسيع نطاق نماذج العالم بنفس النجاح الذي حققته مع نماذج اللغة الكبيرة، فإن الذكاء الاصطناعي ينتقل إلى مستوى جديد. من معالجة المعلومات الرمزية إلى شيء أقرب إلى الفهم الحقيقي للواقع الفيزيائي. ستخرج الروبوتات من المختبرات. ستصبح الأنظمة المستقلة أكثر موثوقية. سيتسارع التخطيط للعمليات المعقدة.
لكن هذا لا يزال في بداية الطريق. تشير MIT Technology Review إلى هذا لأن نماذج العالم ربما تكون أهم اتجاه في الذكاء الاصطناعي في السنوات القليلة القادمة. ستحصل الشركات التي تتعلم أولاً كيفية تعليم الشبكات العصبية الرؤية وفهم العالم على ميزة تنافسية ضخمة.
هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟
AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.