أظهرت General Motors كيف تدرب الطيار الآلي في محاكاة أسرع من الواقع بـ 50 ألف مرة
كشفت General Motors عن كيفية تدريب الذكاء الاصطناعي للقيادة المستقلة من خلال المحاكاة والتعلم المعزز ونماذج VLA. تؤكد الشركة أن بيئة Boxworld المجردة تسمح…
معالج بواسطة الذكاء الاصطناعي من IEEE Spectrum AI؛ بتحرير Hamidun News
كشفت جنرال موتورز، في مادة برعاية، عن كيفية بناء ذكاء اصطناعي قابل للتوسع للقيادة المستقلة. يركز التركيز على المحاكاة والتعلم المعزز ونماذج رؤية اللغة والإجراء التي تساعد في التدريب ليس على الرحلات النموذجية بل على حالات نادرة وخطيرة تحدد ما إذا كان النظام يمكن إطلاقه فعلاً على الطرقات.
لماذا تكون الحالات الحدية صعبة بالنسبة للقيادة الذاتية، المشكلة ليست
في القيادة على طريق سريع فارغ بطقس جيد. الخطر الرئيسي هو ما يسمى بالذيل الطويل: حوادث نادرة وغامضة يصعب التنبؤ بها تحدث نادراً لكنها تظهر بالضبط ما إذا كان يمكن نشر النظام على الطرقات بدون إشراف إنساني مستمر. تصرح جنرال موتورز مباشرة بأن الطريق نحو وضع بدون مراقبة على الطرقات السريعة وما بعده نحو الاستقلالية التامة يعتمد على هذه النسبة الأخيرة من التعقيد.
يتضمن هذا ليس فقط الحالات الغريبة مثل مرتبة على الطريق أو فم سباكة مفجر أو انقطاع كامل للإشارات الضوئية. الحالات اليومية في حركة المرور الكثيفة في المدينة مشكلة أيضاً، حيث يجب على السائق أن يظهر الأدب والحس السليم وأن يفهم السياق بسرعة. على سبيل المثال، كيفية الدخول في طابور موقف سيارات دون حجب تدفق حركة المرور، أو كيفية المرور عبر موقع بناء حيث يتم تنظيم الحركة بإيماءات عامل بدلاً من الإشارات القياسية.
عقبات غير متوقعة على الطريق أنظمة حركة مؤقتة في مناطق الإصلاح إيماءات منظم المرور تتعارض مع إشارات حركة المرور مناورات معقدة في مواقف السيارات الضيقة * انقطاعات متسلسلة في البنية الأساسية للمدينة ## كيف تدرب جنرال موتورز نموذجها أحد المكونات الرئيسية هي نماذج رؤية اللغة والإجراء. بشكل أساسي، تأخذ الشركة معمارية رؤية اللغة الأساسية التي تفهم الصور على مستوى المفاهيم العامة وتكيفها لمهام القيادة. بعد ذلك، لا يرى النموذج فقط صورة بل يفسر مسارات المركبات ويعزل الأشياء ثلاثية الأبعاد ويساعد على فهم ما يحدث فعلاً في مشهد الطريق.
هذا ضروري حتى تتمكن الآلة من التعرف على أن إيماءة شرطي لها الأولوية على ضوء أحمر أو أن المقدمة عبارة عن منطقة انزال طرفي وليست حارة عادية. المشكلة هي أن الفهم الدلالي العميق غالباً ما يقدم تأخيراً غير ضروري، والقيادة، كل جزء من الثانية حرج. لذا تطور جنرال موتورز نظام تردد ثنائي من VLA: نموذج كبير يعمل ببطء أكثر ويكون مسؤولاً عن القرارات الدلالية عالية المستوى، بينما يتعامل نموذج مضغوط مع حلقات التحكم السريعة—التوجيه والكبح والحفاظ على المسار.
يجب على هذا الهجين، بموجب خطة الشركة، أن يجمع بين « الحس السليم » لنماذج الأساس وسرعة الاستجابة الكافية للطرقات الحقيقية.
المحاكاة بدلاً من الطرقات يتم معظم التدريب ليس على شوارع حقيقية بل في
محاكيات. تشير جنرال موتورز إلى أنها تشغل يومياً ملايين السيناريوهات ذات الحلقة المغلقة عالية الدقة—ما يعادل عشرات الآلاف من أيام القيادة البشرية مضغوطة في ساعات من الحوسبة. يمكن للشركة أن تأخذ رحلات حقيقية وتغير الطقس والإضاءة من خلال نماذج الانتشار وإضافة مركبات جديدة أو تجميع مشاهد من الصفر بناءً على الوصفات النصية والمربعات المحيطة المكانية.
لمهام السلوك التكتيكي، الواقعية الفوتوغرافية ليست ضرورية دائماً، لذا تستخدم جنرال موتورز بيئة مجردة تسمى Boxworld داخل محاكيها الخاص بالتعلم المعزز وهي GM Gym. تبقى فقط المعاملات المهمة: موضع الأشياء والسرعة وقواعد المرور وتفاعلات المركبات. يسمح هذا بتشغيل أحجام ضخمة من التجارب حيث يتعلم النموذج ليس لنسخ البشر بل للعثور على استراتيجية بأهداف قابلة للقياس مثل الأمان والتقدم.
يحدث هذا التدريب بسرعات مختلفة: حتى 50000 مرة أسرع من الوقت الفعلي حوالي 1000 كيلومتر من القيادة الافتراضية في الثانية من وقت GPU آلاف السائقين الافتراضيين في الثانية في بيئة واحدة 30 دقيقة من التقطير مقابل حوالي 12 ساعة من التعلم المعزز الخام بعد ذلك، يتم نقل المعرفة من البيئة المجردة إلى نموذج أكثر واقعية من خلال تقطير السياسة المباشرة: سياسة التعلم المعزز المبسطة تعمل كـ « معلم » للنموذج الذي سيعمل لاحقاً في المركبة. بشكل منفصل، تستخدم جنرال موتورز خط أنابيب SHIFT3D لإنشاء أشياء محددة حيث قد يفشل نظام الإدراك وتضيف وحدة عدم اليقين الإبستيمولوجي التي تشير إلى المشاهد حيث يكون النموذج حقاً « غير متأكد ». وفقاً للشركة، فإن التدقيق على مثل هذه الحالات الصعبة قد قلل بالفعل الاصطدامات القريبة من الفشل بأكثر من 30 بالمئة.
ماذا يعني هذا يظهر نهج جنرال موتورز الاتجاه الذي تسير إليه صناعة
القيادة المستقلة: ليس نحو نموذج واحد « ذكي » بل نحو نظام بيئي كامل من المحاكاة والنماذج العالمية التوليدية والتعلم المعزز وأنظمة تقييم عدم اليقين. إذا كان مثل هذا النظام قابلاً للتوسع حقاً، فإن الأصل الرئيسي في سباق الطيار الآلي لن يكون فقط أسطول مركبات على الطرقات بل أيضاً جودة البنية الأساسية التي يمكنها بسرعة تخيل واختبار وكسر السيناريوهات النادرة قبل أن يلتقيها المستخدمون.
هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟
AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.