Jiqizhixin (机器之心)→ المصدر

LingBot-VLA: تعلم Ant Group الروبوتات فهم العالم بدون كلام

تخيّل أنك اشتريت هاتفاً ذكياً جديداً ولا تحتاج إلى تعلم كيفية استخدامه من جديد — أصابعك تعرف بالفعل أين تلمس. في عالم الروبوتات، كانت الأمور مختلفة دائماً…

معالج بواسطة الذكاء الاصطناعي من Jiqizhixin (机器之心)؛ بتحرير Hamidun News
LingBot-VLA: تعلم Ant Group الروبوتات فهم العالم بدون كلام
المصدر: Jiqizhixin (机器之心). كولاج: Hamidun News.
◐ استمع للمقال

تخيّل أنك اشتريت هاتفاً ذكياً جديداً ولا تحتاج إلى تعلم كيفية استخدامه من جديد — أصابعك تعرف بالفعل أين تلمس. في عالم الروبوتات، كانت الأمور مختلفة دائماً: كل 'جهاز' يتطلب رمزاً فريداً خاصاً به وآلاف الساعات من التدريب في المحاكاة. لكن فريق Lingbo، وهو فرع من عملاق التكنولوجيا الصيني Ant Group، قرر أن الوقت قد حان لإنهاء هذا. أطلقوا LingBot-VLA للمجال العام — نموذج يدّعي أنه الدماغ الكوني لكل شيء له محركات ومعالجات.

كان جوهر مشكلة 'الذكاء الاصطناعي الفيزيائي' دائماً يرتكز على ما نسميه التعارض الأنطولوجي. إذا قمت بتدريب شبكة عصبية على التحكم بمشبك معين، فإنها تصبح عاجزة تماماً عند نقلها إلى روبوت إنساني ثنائي الأرجل. تحاول LingBot-VLA حل هذا التنافر المعرفي. كنموذج من فئة الرؤية واللغة والعمل (VLA)، فهي لا 'ترى' صورة و'تقرأ' نصاً فحسب. إنها تترجم هذه البيانات إلى متجهات حركة محددة يمكن لأنواع مختلفة من الروبوتات فهمها. إنه مثل قائد سيارة واحد يمكنه أن يتحكم بمهارة متساوية في الدراجة الهوائية وشاحنة الحفار بدون تدريب إضافي.

لماذا يحدث هذا الآن؟ نحن نشهد انتقالاً من 'الذكاء الاصطناعي الثرثار' إلى 'الذكاء الاصطناعي الفاعل'. تعلّم الروبوتات الحوارية كتابة الشعر، لكنها لا تزال غير قادرة على مسح الغبار عن الطاولة دون كسر مزهرية. كي يكون الروبوت مفيداً في الحياة اليومية، يحتاج إلى القدرة على التعميم. تُظهر LingBot-VLA نتائج قياسية في اختبارات تعميم المهام: فهي تفهم الأمر 'احضر تفاحة' حتى في غرفة غريبة وبنوع مشبك غريب. استخدم المطورون مجموعة بيانات ضخمة تجمع بين الصور البصرية ومسارات الحركة، مما سمح للنموذج ببناء منطق داخلي للمكان.

السياق السياسي مثير للاهتمام أيضاً. بينما تحتفظ شركات أمريكية مثل Figure أو Tesla بتطوراتها تحت طي الكتمان، اختارت عملاقة التكنولوجيا الصينية Ant Group طريق البرمجيات مفتوحة المصدر. إنها حركة استراتيجية: إذا أصبحت LingBot-VLA معياراً لصغار مصنعي الروبوتات في جميع أنحاء العالم، فستسيطر الصين فعلياً على نظام التشغيل للإنترنت الفيزيائي' في المستقبل. إنها لعبة كلاسيكية على المدى الطويل حيث تكون الهيمنة على مستوى المعايير أهم من الأرباح الفورية من بيع الرخص.

بالنسبة للصناعة، هذا يعني انخفاضاً حاداً في حاجز الدخول. الآن لا تحتاج شركة ناشئة إلى استئجار مئة حامل شهادة دكتوراه لتدريب الحركات الأساسية للروبوت — يمكنها أن تأخذ 'أساساً' جاهزاً وتكييفه لمهمة معينة. نحن نقترب من لحظة يصبح فيها الجهاز الصلب ثانوياً ويصبح البرنامج الحاسوبي حاسماً. إذا كانت LingBot-VLA حقاً بنفس براعة التكيف كما يزعم المطورون، فسنشهد في بضع سنوات غزواً من الروبوتات ستتوقف أخيراً عن التحرك بحماقة أمام باب مغلق.

بالطبع، ثمة أسئلة تتعلق بالسلامة والدقة — في العالم المادي، الخطأ يكلف أكثر من خطأ إملائي في برنامج حواري. لكن الاتجاه واضح: الذكاء الاصطناعي يخرج من شاشات الهواتف الذكية إلى الواقع. كل ما تبقى لنا هو مراقبة ما يسرعة هذه 'الأدمغة' ستكتسب 'أجساداً' جديرة بها.

الأساسي: يمكن لـ LingBot-VLA أن تصبح 'أندرويد' عالم الروبوتات، مما يجعل التحكم الكوني بالروبوتات متاحاً للجميع. هل نحن مستعدون لأن تكون البرمجيات مفتوحة المصدر الآن قادرة على تحريك الأشياء في شقتنا؟

ZK
Hamidun News
أخبار الذكاء الاصطناعي بدون ضوضاء. اختيار تحريري يومي من أكثر من 400 مصدر. منتج من جمال حميدون، رئيس الذكاء الاصطناعي في Alpina Digital.

هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟

AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.

ما رأيك؟
جارٍ تحميل التعليقات…