روبوت يعتمد على Google LLM: كيف جرى تدريب نموذج بـ270M معلمة على التحكم في الحركة
نجح مهندس في دمج نموذج لغة مدمج من Google (270 مليون معلمة) في روبوت مجنزر مزود بذراع مناولة، ودرّبه على العمل في المحاكاة. وتعلّم النموذج اتخاذ قرارات مستقلة ب

قام مهندس بدمج نموذج اللغة المفتوح المضغوط من Google (270 مليون معامل) في روبوت يعمل بالجنازير مع ذراع محاكاة، وقام بتدريب النموذج للتحكم في حركاته حصراً في المحاكاة. تثبت التجربة أن نماذج اللغة الكبيرة المضغوطة قادرة على تعلم التحكم في الأنظمة الفيزيائية المعقدة دون موارد حوسبية ضخمة.
لماذا نموذج لغة كبير مضغوط
أطلقت Google سلسلة من نماذج Gemini Nano المضغوطة المصممة للأجهزة ذات موارد الحوسبة المحدودة. النموذج بـ 270 مليون معامل ليس GPT-4 وحشياً، بل هو أداة أنيقة ومصممة بعناية يمكن تشغيلها مباشرة على أنظمة الروبوت المدمجة دون استدعاء خوادم السحابة. توفر هذه العمارة عدة مزايا حاسمة للروبوتات. أولاً، يعمل النموذج محلياً ولا يتطلب اتصال إنترنت — الروبوت مستقل تماماً. ثانياً، يستجيب دون تأخير زمن الانتقال في الشبكة، وهو أمر حاسم عندما تحدد الميلي ثوان نتيجة العملية. ثالثاً، استهلاك الطاقة منخفض — تدوم بطارية الروبوت لفترة أطول والإلكترونيات لا تسخن بشكل زائد. اختار المؤلف هذا النموذج بالذات لأن أدائه كافٍ تماماً لاتخاذ القرارات في التحكم في الأنظمة الفيزيائية. تتعلم النماذج المضغوطة بشكل أسرع من نماذج اللغة الضخمة وتتطلب بيانات أقل للتدريب.
التدريب في بيئة افتراضية
أجريت التجربة بأكملها في محاكاة — بيئة افتراضية حيث يتوافق سلوك الفيزياء والديناميكا مع الواقع. تحرك الروبوت بالجنازير مع الذراع المحاكاة ليس في غرفة حقيقية، بل في نموذج حاسوبي. سمح هذا للمؤلف باختبار آلاف متغيرات السلوك بسرعة دون خطر إتلاف معدات حقيقية مكلفة. تلقى نموذج اللغة معلومات عن حالة الروبوت — موضع الجنازير، زاوية الدوران، إحداثيات الذراع المحاكاة، صور من الكاميرا الافتراضية — وتدرب بشكل مستقل على اتخاذ قرارات حول كيفية التصرف. تدرب النموذج على نفسه على أداء المهارات التالية:
- التحكم في الجنازير: متى يتم التفعيل، في أي اتجاه وبأي سرعة
- الملاحة والتوجيه: كيفية الدوران والتوجه في الفضاء
- المناولة: كيف يجب أن تقترب الذراع وتمسك وتحرك الأشياء
- التنسيق: كيفية تنسيق حركة الجسم والذراع لتنفيذ المهام المعقدة
تعلم النموذج من خلال التجربة والخطأ: حاول إجراء، ورأى النتيجة في المحاكاة، وصحح سلوكه. العملية ليست فورية، لكن بعد مئات الآلاف من التكرارات، وجد النموذج استراتيجيات تحكم فعّالة. في النهاية، تعلم أداء عمليات المناولة المقصودة — إمساك الأشياء، تحريكها، تكديسها — تماماً كما لو كان الروبوت حقيقياً.
سايبربانك بدلاً من التسويق
يطلق المؤلف على مشروعه "سايبربانك" — تجربة مثيرة من الناحية التقنية والمثيرة للجدل في نفس الوقت. الفلسفة بسيطة: إذا أخذت نموذج مفتوح المصدر وحملته في روبوت وتركته يتعلم في المحاكاة، هل يمكن أن يصبح قوة عمل مفيدة؟ عادة ما يجيب المتشككون بـ "لا" — فهم يقولون أن الروبوتات تتطلب بنية معمارية خاصة وملايين المعاملات وملايين البيانات. إجابة المؤلف: لا، يمكنه. وهو يعمل. لا يتطلب معاملات ضخمة أو بنى معمارية خاصة أو بيانات لا نهاية لها. النموذج المضغوط بـ 270 مليون معامل كافٍ للتعلم، في ظروف المحاكاة، للتحكم في نظام ميكانيكي غير بسيط — روبوت بالجنازير مع ذراع محاكاة تؤدي عمليات مناولة في الفضاء ثلاثي الأبعاد. المفارقة هي أن النماذج المضغوطة غالباً ما تكون أكثر تنوعاً من الأدوات المتخصصة.
ماذا يعني هذا
تمحو التجربة الحدود بين نماذج اللغة "النقية" والتحكم في الأنظمة الفيزيائية. غداً، قد تتحكم نماذج اللغة الكبيرة المضغوطة بشكل طبيعي في المحاكيات الصناعية والمنصات المستقلة والروبوتات المتنقلة في الموقع — في الورش والمستودعات والزراعة واللوجستيات. دون استدعاء السحابة، دون تأخير نقل الشبكة، بتراخيص مفتوحة وبأسعار معقولة. هذا، بالطبع، عندما تتعلم النماذج نقل المعرفة بشكل موثوق من المحاكاة إلى الواقع — ما يسمى بنقل sim-to-real. وهذا قد بدأ بالفعل.