Unitree UnifoLM-VLA-0: الروبوتات الصينية تتعلم التفكير باستخدام اليدين
لطالما نظرنا إلى الروبوتات البشرية الشكل باعتبارها قطع آلية مثيرة للإعجاب يمكنها أن تقوم بحركات بهلوانية لكنها تتجمد أمام مقبض باب عادي. المشكلة لم تكن في…
معالج بواسطة الذكاء الاصطناعي من 36Kr (36氪)؛ بتحرير Hamidun News
لطالما نظرنا إلى الروبوتات البشرية الشكل باعتبارها قطع آلية مثيرة للإعجاب يمكنها أن تقوم بحركات بهلوانية لكنها تتجمد أمام مقبض باب عادي. المشكلة لم تكن في المحركات، بل في "الرأس". والآن قررت Unitree، الشركة التي ألفتنا على الروبوتات الميسورة التكلفة، أن تأخذ الذكاء الاصطناعي على محمل الجد.
لقد فتحت الكود المصدري لـ UnifoLM-VLA-0، وهذا الحدث قد يغير قواعد اللعبة في الصناعة بسرعة أكبر مما يبدو للوهلة الأولى. نحن ننتقل أخيراً من الشبكات العصبية البسيطة التي تستطيع فقط التحدث، إلى نماذج مثل VLA (Vision-Language-Action)، القادرة على التحكم بجسم مادي في الفضاء الحقيقي. لفهم مدى الأهمية، نحتاج إلى تذكر كيف كانت الروبوتات تتعلم سابقاً.
كان ذلك عادة إما منطق برمجي صارم أو تعلم معزز لمهمة محددة وضيقة. إذا علمت روبوتاً فتح الثلاجة، فذلك كل ما يستطيع فعله. يعمل UnifoLM-VLA-0 بشكل مختلف.
إنه سليل نماذج اللغة الكبيرة التي خضعت لضبط دقيق على بيانات محددة للتفاعل المادي. النتيجة هي "دماغ متجسد" يفهم السياق. إنه لا يرى فقط تفاحة على الطاولة، بل يفهم كيفية التقاطها، بأي قوة يضغط عليها، وأين يضعها، بناءً على الأمر النصي من المستخدم.
الشيء الأكثر سخرية هنا هو أن Unitree اختارت مسار الانفتاح. بينما يبني عمالقة الغرب وحتى بعض المنافسين الصينيين "حدائق مسيجة"، يخفون هندسة أنظمة التحكم الخاصة بهم، تضع Unitree أوراقها على الطاولة. هذا حساب استراتيجي.
بفتح الكود المصدري لـ UnifoLM-VLA-0، هم في الواقع يدعون آلاف المطورين حول العالم لاختبار، تحسين، وتكييف نموذجهم مع مجموعة واسعة من الأجهزة. هذه حركة كلاسيكية من كتاب تاريخ البرمجيات: إذا لم تستطع الفوز على الجميع وحدك، كن المعيار للجميع. إذا كان كل مشروع أبحاث روبوتات ثاني غداً يستخدم أدمغة Unitree، فستحل قضية القيادة الصناعية بنفسها.
من الناحية التقنية، يحاول نموذج UnifoLM-VLA-0 سد الفجوة بين الفهم البصري (VLM) والعمل الحقيقي. غالباً ما تهلوس النماذج العادية أو لا تفهم قوانين الفيزياء - يمكنها أن "تقول" أنها رفعت كوباً، لكن يدها الافتراضية ستمر من خلاله. الهندسة الجديدة من Unitree تهدف إلى أن يمتلك الروبوت ما يسميه المهندسون "الحس السليم المادي".
هذا هو المعرفة بأن الأشياء لها وزن واحتكاك وقصور ذاتي. بدون ذلك، ستظل الروبوتات البشرية الشكل ألعاباً مكلفة للمعارض، قادرة فقط على التلويح للعابرين في دورة مسجلة مسبقاً. ماذا يعني هذا بالنسبة لنا؟ من المحتمل أن نرى قفزة حادة في قدرات الروبوتات المنزلية والمستودعات في السنة أو السنتين القادمتين.
عندما تصبح البرمجيات ملك الجميع، يتسارع التقدم بشكل أسي. رأينا هذا بالفعل مع نماذج اللغة بعد إطلاق LLaMA. الآن حان دور العالم المادي.
بالطبع، روبوت خادم حقيقي لا يزال بعيداً جداً، لكن الأساس على شكل "دماغ" مفتوح قد تم وضعه بالفعل. الآن يعتمد الأمر على المجتمع، الذي يجب أن يعلم هذا الدماغ ليس فقط فهم الأوامر، بل أيضاً عدم كسر كل شيء في عملية تنفيذها. النقطة الأساسية: Unitree تراهن على المصدر المفتوح، محاولة أن تصبح "أندرويد" العالم الروبوتي.
هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟
AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.