NVIDIA Developer Blog→ المصدر

حسّنت NVIDIA BEV pooling على GPU للمركبات ذاتية القيادة والروبوتات وAI المكاني

شرحت NVIDIA كيفية تسريع BEV pooling على GPU — وهي عملية أساسية في أنظمة الإدراك للمركبات ذاتية القيادة والروبوتات. تجمع نماذج BEV صورًا من عدة كاميرات في…

معالج بواسطة الذكاء الاصطناعي من NVIDIA Developer Blog؛ بتحرير Hamidun News
حسّنت NVIDIA BEV pooling على GPU للمركبات ذاتية القيادة والروبوتات وAI المكاني
المصدر: NVIDIA Developer Blog. كولاج: Hamidun News.
◐ استمع للمقال

نشرت NVIDIA دليلاً تقنياً مفصلاً لتسريع تجميع BEV على معالجات الرسوميات الخاصة بها — وهي عملية تصبح إلزامية لأي نظام يتمتع بعدة كاميرات: من السيارات المستقلة إلى الروبوتات الصناعية وأنظمة الذكاء الاصطناعي المكاني.

ما هي رؤية العين الثالثة في الإدراك BEV

BEV اختصار لـ Bird's-Eye-View — وهي رؤية من أعلى لأسفل. بدلاً من معالجة الصور من ست إلى ثماني كاميرات بشكل منفصل، يقوم النموذج بإسقاط الميزات من كل واحدة منها على خريطة واحدة من أعلى لأسفل. على هذه الخريطة، يتم تطبيق الذكاء الاصطناعي على المساحة بنفس الطريقة التي ينظر بها الإنسان إلى خريطة الطريق: فهو يرى الحارات والسيارات والمشاة والمساحة الحرة في نظام إحداثيات واحد.

قبل ظهور BEV، كانت معظم الأنظمة تستخدم كاشفات مستقلة لكل كاميرا ووحدة اندماج بيانات منفصلة. كان هذا يسبب عدم تناسق في حدود مجال الرؤية لكل كاميرا ويعقد تقدير المسافات. يحل BEV المشكلة بشكل أساسي — الإسقاط على مساحة واحدة يزيل التسييب بين الكاميرات ويبسط تخطيط المسار اللاحق. أصبحت نماذج BEV المعيار الفعلي في الطيارين الآليين والروبوتات. في الروبوتات الصناعية، يتيح هذا النهج لمكدس الملاحة الحصول على صورة متماسكة للبيئة المحيطة دون الحاجة إلى اندماج بيانات معقد بين عدة مصنفات مستقلة.

حيث ينشأ الاختناق

العملية الرئيسية في خط أنابيب BEV هي التجميع نفسه: يجب "الاستعلام" عن كل نقطة على الخريطة من أعلى لأسفل مقابل كل واحدة من الكاميرات، واسترجاع الميزة المقابلة من خريطة الميزات، وحساب متوسط النتائج. بدقة خريطة BEV 200×200 خلية وست كاميرات، يتعلق الأمر بعشرات الملايين من العمليات مع أنماط وصول ذاكرة فوضوية.

  • الوصول غير الخطي للذاكرة غير متوافق مع ذاكرة التخزين المؤقت لمعالج الرسوميات — قد يؤدي كل وصول إلى فشل في الذاكرة المؤقتة
  • عرض النطاق الترددي للذاكرة يصبح عنق الزجاجة الحقيقي، وليس قوة الحوسبة للأنوية
  • يستحوذ تجميع BEV على 30–40٪ من إجمالي وقت دورة الاستدلال
  • عندما يتم تحديث الخريطة بتردد 20 هرتز، تتراكم الكوابح بسرعة حرجة
  • تتعطل تطبيقات CUDA الساذجة حتى على معالجات الرسوميات القوية بمراكز البيانات وشرائح Orin

تشرح NVIDIA بالتفصيل لماذا لا يمكن حل المشكلة ببساطة عن طريق زيادة قوة معالج الرسوميات — يجب تحسين نمط الوصول للذاكرة وترتيب العمليات الحسابية نفسها.

ما تقترحه NVIDIA

الحل الرئيسي هو نوى CUDA محسنة مع ترتيب عمليات مصمم بعناية والاستخدام الفعال للذاكرة المشتركة. الفكرة الأساسية هي تجميع الطلبات بحيث يصل عدة مواضيع إلى عناوين متجاورة في نفس الوقت. هذا يحول الوصول العشوائي الفردي إلى معاملات دفعية فعالة، والتي يعالجها معالج الرسوميات بسرعة أكبر بكثير.

توفر NVIDIA أيضاً مكون إضافي جاهز لـ TensorRT: فهو يندمج في أي خط أنابيب استدلال دون إعادة كتابة النموذج. بالنسبة للفرق التي تستخدم بالفعل TensorRT في الإنتاج، هذا ذو قيمة خاصة — يتم تطبيق التحسين دون تغيير معمارية الشبكة.

تصف تقنية منفصلة الحساب المسبق لفهارس الإسقاط: يتم حساب المراسلات بين خلايا BEV وبكسلات الكاميرا مرة واحدة أثناء التهيئة وتخزينها في الذاكرة. على شرائح Jetson Xavier و Orin — التي تقوم بتجهيز الروبوتات الحقيقية والسيارات المستقلة — يوفر هذا دفعة ملحوظة على وجه التحديد بسبب قوة الحوسبة المحدودة مقارنة بمعالجات الرسوميات في مراكز البيانات.

"تطبيق تجميع BEV الصحيح هو الفرق بين نظام يعمل في الوقت الفعلي ونظام

لا يمكنه مواكبة الخطى"، وفقاً للمادة التقنية من NVIDIA.

ماذا يعني هذا

يتحول الإدراك BEV من مفهوم بحثي إلى مكون أساسي من الذكاء الاصطناعي الفيزيائي — وهو المصطلح الذي تستخدمه NVIDIA بشكل متزايد لوصف الروبوتات والسيارات المستقلة والأتمتة الصناعية. يحدد تحسين العمليات الأساسية مثل تجميع BEV بشكل مباشر عدد الكاميرات التي يمكن الاستفادة منها وتكرار تحديث خريطة الإدراك. بالنسبة للفرق العاملة على منصة NVIDIA Jetson أو استخدام TensorRT، يوفر هذا الدليل أدوات تسريع ملموسة دون الحاجة إلى تغيير معمارية النموذج.

ZK
Hamidun News
أخبار الذكاء الاصطناعي بدون ضوضاء. اختيار تحريري يومي من أكثر من 400 مصدر. منتج من جمال حميدون، رئيس الذكاء الاصطناعي في Alpina Digital.

هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟

AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.

ما رأيك؟
جارٍ تحميل التعليقات…