Habr AI→ المصدر

تم تجميع pipeline لـ Physical AI خاص بـ SO-101 بالاعتماد على ROS2 وLeRobot مقابل 30 ألف روبل

ظهر مثال نادر في مجال Physical AI على pipeline متكامل يمكن إعادة تنفيذه في المنزل: ذراع SO-101، وتحكم native في ROS2، وتسجيل العروض التوضيحية، وتحويلها إلى…

معالج بواسطة الذكاء الاصطناعي من Habr AI؛ بتحرير Hamidun News
تم تجميع pipeline لـ Physical AI خاص بـ SO-101 بالاعتماد على ROS2 وLeRobot مقابل 30 ألف روبل
المصدر: Habr AI. كولاج: Hamidun News.
◐ استمع للمقال

طورت مجتمع المصادر المفتوحة مجموعة عملية من Physical AI لمعدل التعديل الرخيص SO-101: فهي تغطي الطريق بالكامل من العرض بالتحكم عن بعد إلى التنفيذ المستقل للمهام على روبوت حقيقي. بدلاً من النصوص البرمجية المتناثرة، يربط المشروع ROS2 و LeRobot و imitation learning في خط أنابيب موحد قابل للتكرار بتكلفة إعداد تبلغ حوالي 30 ألف روبل.

كيف تم تنظيم المجموعة

الفكرة الرئيسية للمشروع ليست نموذجاً جديداً، بل أن الروبوتيات والتعلم الآلي لا يعودان يعيشان بشكل منفصل. في الأسفل يوجد معدل التعديل SO-101 نفسه، وفوقه طبقة ros2_control مع واجهة أجهزة لمحركات الخدمة Feetech STS3215، ثم يرتفعان التحكم عن بعد والكاميرات وتسجيل الحلقات والاستدلال. نتيجة لذلك، يرى النظام الروبوت كجهاز ROS2 عادي، وليس كمجموعة من النصوص البرمجية المرتبطة بلوحة واحدة. هذا يجعل المجموعة محمولة ومريحة للتعديل.

فوق هذا يتم تشغيل التحكم عن بعد leader/follower: يوضح المشغل الحركة المطلوبة، ويكرر ذراع المتابع حركته مع توليد بيانات التدريب في نفس الوقت. أثناء العروض التوضيحية، يسجل المشروع الحلقات في rosbag أو MCAP، ويعمل مع كاميرات متعددة، ويسمح بالتحقق من الملاحظات والإجراءات من خلال التصور في Rerun. هذه نقطة مهمة: لا يمكن جمع البيانات فحسب، بل يمكن تصفيتها بسرعة قبل التدريب إذا أثبتت المزامنة أو زوايا الكاميرا أو المسارات أنها غير ناجحة.

المسار من البيانات

بعد التسجيل، يحول المشروع الحلقات من صيغ ROS إلى مجموعة بيانات LeRobot. هذا جسر بين عالم ROS2 والتعلم الآلي، الذي يزيل التنسيقات الوسيطة محلية الصنع ويسمح بانتقال أسرع إلى تدريب السياسة. بعد ذلك، يمكنك محاولة التعلم بالمحاكاة من البداية إلى النهاية باستخدام نماذج مثل ACT أو SmolVLA، ثم إعادة السياسة المكتسبة إلى دائرة ROS2 للروبوت. هذا الطريق مهم أيضاً لأنه يعتمد على النظام البيئي الموجود بالفعل من الأدوات.

عملياً يبدو سير العمل بأكمله هكذا:

  • بدء تشغيل معدل التعديل الروبوتي وتشغيل ros2_control
  • جمع العروض التوضيحية من خلال التحكم عن بعد leader/follower
  • تسجيل الحلقات في rosbag أو MCAP
  • التحقق من تدفقات الكاميرا والإجراءات والملاحظات في Rerun
  • التحويل إلى مجموعة بيانات LeRobot، وتدريب السياسة والنشر على الروبوت

قوة منفصلة للمجموعة هي فصل وقت التشغيل على جانب الروبوت والنموذج الثقيل. إذا كانت الحوسبة المحلية بالقرب من الذراع غير كافية، يمكن تشغيل السياسة على خادم GPU خارجي من خلال policy_server، بينما يحافظ جانب الروبوت على عميل الاستدلال فقط ودائرة التنفيذ. بالنسبة إلى Physical AI، هذا ليس تجميلياً بل فصل هندسي عادي: تبقى حلقة التحكم بالقرب من الأجهزة، و«الدماغ» ينقسم بشكل مستقل. هذا يبسط التجارب مع النماذج الأثقل ويقلل المتطلبات لأجهزة جانب الروبوت.

أين القيمة العملية

تنكسر مثل هذه المشاريع عادة عند تقاطع التخصصات: يمكن للروبوت التحرك لكن البيانات تُجمع بشكل سيء؛ مجموعة البيانات موجودة لكن لا يمكن إعادتها إلى الأجهزة بدون معاناة؛ النموذج يتدرب لكن لا يعيش في وقت التشغيل الفعلي. هنا بالضبط يتم تغطية الأجزاء الأكثر ملل لكن الأكثر قيمة - البدء والتسجيل والتحكم البصري والتحويل وإعادة التكامل مع ROS2. لذلك تبدو المجموعة وكأنها منصة تعليمية عملية للذكاء الجسدي، وليست عرضاً بحثياً.

المشروع مفيد بشكل خاص لمن يريدون الدخول إلى Physical AI بدون ميزانية معملية. على SO-101 رخيصة يمكنك أولاً تصحيح الأشياء الأساسية - الطاقة والمعايرة والتحكم عن بعد والكاميرات وقالب البيانات وكمون الاستدلال - ثم الانتقال إلى معدلات تعديل أكثر تعقيداً. يوفر هذا النهج أشهراً: أولاً تبني خط أنابيب قابل للتكرار، ثم تجرب السياسة، وليس العكس. بالنسبة للطلاب وفرق البحث والشركات الناشئة الصغيرة، هذا يقلل بشكل ملحوظ من حاجز الدخول.

ماذا يعني هذا

يخرج Physical AI تدريجياً من وضع العرض التقديمي ويدخل مجموعات open-source قابلة للتكرار. إذا كان بإمكان معدل تعديل رخيص أن ينهض كنظام ROS2، ويتم جمع العروض التوضيحية عليه، وتدريب السياسة وإعادتها إلى الأجهزة، فإن حاجز الدخول إلى embodied AI ينخفض بشكل ملحوظ للمهندسين والفرق الصغيرة. هذا يعني أن المزيد من التجارب ستحدث ليس على الشرائح بل على الطاولات الحقيقية والمختبرات.

ZK
Hamidun News
أخبار الذكاء الاصطناعي بدون ضوضاء. اختيار تحريري يومي من أكثر من 400 مصدر. منتج من جمال حميدون، رئيس الذكاء الاصطناعي في Alpina Digital.

هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟

AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.

ما رأيك؟
جارٍ تحميل التعليقات…