يان لوكن يقدم LeWorldModel — نموذج JEPA بدون انهيار التمثيلات من البيكسل
قدم يان لوكن وزملاؤه LeWorldModel — نموذج عالمي JEPA جديد يتعلم مباشرة من بيانات البيكسل دون stop-gradient و EMA والمشفرات المتجمدة. يحتوي النموذج على دالتي…
معالج بواسطة الذكاء الاصطناعي من MarkTechPost؛ بتحرير Hamidun News
قدمت فريق من الباحثين بقيادة يان لوكان نموذج LeWorldModel، أو LeWM - وهو نموذج عالمي جديد لتدريب الوكلاء مباشرة على بيانات البكسل. يؤكد المؤلفون أن النموذج يحل إحدى المشاكل الرئيسية لنهج JEPA - انهيار التمثيل - بينما يسرع بشكل كبير عملية التخطيط.
لماذا ينهار JEPA
النماذج العالمية ضرورية للوكلاء لبناء خريطة داخلية مضغوطة للبيئة وحساب الإجراءات ليس في الإطارات الخام، بل في الفضاء الكامن. ومع ذلك، عند التدريب مباشرة على الصور، تقع هذه الأنظمة غالباً في انهيار التمثيل: تبدأ المشاهد المختلفة في الترميز بطريقة متشابهة جداً، والنموذج ينفذ رسمياً مهمة التنبؤ لكنه يفقد البنية المفيدة للعالم. لهذا السبب، يجب على المطورين تأمين التدريب بتقنيات إضافية - إيقاف التدرج، والمتوسط المتحرك الأسي، والمشفرات المجمدة، ودوال الخسارة متعددة المكونات. المشكلة مؤلمة بشكل خاص للوكلاء الذين يحتاجون إلى التخطيط لسلاسل طويلة من الإجراءات: إذا تدهور الفضاء الكامن، يتوقف المخطط عن التمييز بين السيناريوهات الجيدة والسيئة.
كيف يعمل LeWM
يحاول LeWM إزالة هذا التعقيد. تتكون البنية المعمارية من جزأين رئيسيين: مشفر يترجم إطاراً إلى تمثيل كامن مضغوط، ومتنبئ يقدر الحالة التالية بناءً على الحالة الحالية والإجراء. يستخدم التنفيذ ViT-Tiny بحوالي 5 ملايين معامل ومتنبئ محول بحوالي 10 ملايين معامل، بحيث يتناسب النظام بأكمله مع 15 مليون معامل، وبحسب المؤلفين، يتم تدريبه على وحدة معالجة رسومات واحدة في غضون بضع ساعات.
الفكرة الأساسية هي عدم إنشاء أهداف إضافية، بل الاحتفاظ فقط بالتنبؤ بالتضمين التالي ومنتظم SIGReg. يجبر SIGReg المتجهات الكامنة على البقاء متنوعة وقريبة من توزيع غاوس متساوي الخواص. للقيام بذلك، لا ينظر النموذج إلى الفضاء بأكمله ككل، بل إلى مجموعة من الإسقاطات العشوائية أحادية البعد ويتحقق من إحصائياتها. يجب أن يقلل هذا النهج من خطر التمثيلات المتدهورة دون عبء هندسي ثقيل.
من الناحية العملية، يحتفظ LeWM بمعامل تشعبي واحد فقط مهم حقاً - وزن التنظيم λ - بينما أقرب بديل end-to-end، PLDM، يحتوي على عدد أكبر بكثير من الإعدادات. يلاحظ المؤلفون أيضاً بشكل منفصل أنه من أجل الاستقرار، ساعد الإسقاط 0.1 في المتنبئ وطبقة إسقاط صغيرة بعد المشفر.
ما أظهرته الاختبارات
بناءً على نتائج الورقة، تبين أن LeWM ليس فقط أكثر استقراراً أثناء التدريب، بل أسرع أيضاً في مرحلة التخطيط. يقارن المؤلفون بينه وبين PLDM و DINO-WM على مهام الملاحة والمعالجة والتحكم في بيئات ثنائية الأبعاد وثلاثية الأبعاد. يعمل النموذج مباشرة مع البكسل، بدون مشفر foundation مجمد وبدون الاعتماد على المهام التي تتطلب مكافأة، لكنه يبقى قادراً على المنافسة على عدة معايير.
- حوالي 200 مرة أقل من الرموز لكل إطار مقارنة بـ DINO-WM
- حتى 48 مرة أسرع للتخطيط: حوالي 0.98 ثانية مقابل 47 ثانية لكل دورة
- فقط دالتا خسارة بدلاً من سبع دوال في نهج PLDM القائمة على VICReg
- معامل تشعبي واحد رئيسي بدلاً من مجموعة من الإعدادات اليدوية
- الفضاء الكامن يلتقط الكميات الفيزيائية ويحدد الأحداث "المستحيلة" مثل نقل الأجسام
اختبر المؤلفون بشكل منفصل ما إذا كان النموذج يفهم المنطق الفيزيائي للمشهد، بدلاً من مجرد التنبؤ بالإطارات التالية. في اختبارات انتهاك التوقع، تفاعل النظام بقوة أكبر مع الأحداث غير المعقولة فيزيائياً، مثل نقل الجسم فجأة، أكثر من التغييرات البحتة البصرية. تأثير مثير للاهتمام آخر هو تصحيح مسار الكامن الزمني: مع تقدم التدريب، أصبحت المسارات في الفضاء الكامن أكثر سلاسة وخطية حتى بدون عقوبة منفصلة من شأنها أن تفرض هذا السلوك بشكل صريح. هذا مهم لأن المسارات الكامنة الأكثر سلاسة تبسط عادة بحث الإجراءات أثناء التخطيط.
ما يعنيه هذا
بالنسبة لسوق الوكلاء، هذه إشارة مهمة: النماذج العالمية تصبح اتجاهاً عملياً مرة أخرى، وليست مجرد فكرة أكاديمية. إذا أكد LeWM والنهج المماثلة النتائج خارج معايير الاختبار في الحالات المعملية، سيتمكن المطورون من بناء وكلاء أسرع وأرخص يخططون في فضاء حالة مضغوط بدون مشفرات foundation ثقيلة. هذا مثير للاهتمام بشكل خاص للروبوتات والتعلم غير المتصل والأنظمة التي تكون فيها تكلفة الخطأ والتأخير حرجة. في الواقع، يظهر LeWM أن محاربة انهيار التمثيل يمكن أن تتم ليس بتعقيد المكدس، بل بصياغة مهمة التعلم نفسها بعناية أكبر.
هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟
AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.