Ant Group تعلم الروبوتات الحياة: أساس VLA جديد يتفوق على Pi0.5
بينما رأسماليو المخاطر الغربيون يغمرون الشركات الناشئة مثل Physical Intelligence بالأموال، ظهر لاعب على الأفق لم يكونوا يتوقعونه بوضوح. قررت مجموعة Ant…
معالج بواسطة الذكاء الاصطناعي من Jiqizhixin (机器之心)؛ بتحرير Hamidun News
بينما رأسماليو المخاطر الغربيون يغمرون الشركات الناشئة مثل Physical Intelligence بالأموال، ظهر لاعب على الأفق لم يكونوا يتوقعونه بوضوح. قررت مجموعة Ant Group، الشركة التي اعتدنا ربطها بالمدفوعات والتكنولوجيا المالية، أن الروبوتات تحتاج أيضاً إلى أدمغة. وليس مجرد أدمغة، بل نموذج VLA مفتوح المصدر (Vision-Language-Action) الذي يتفوق في جوانب كثيرة على حبيب الصناعة الحالي — Pi0.
5. إن كنت تعتقد أن الصراع على الذكاء الاصطناعي المادي محصور في وادي السيليكون، فلدي أخبار لك. دعنا أولاً نفهم ما هو نموذج VLA.
إنه ليس مجرد روبوت دردشة آخر يكتب الشعر. إنها محاولة لإنشاء شبكة عصبية موحدة ترى العالم، وتفهم الأوامر النصية، والأهم من ذلك، تعرف كيفية تحريك "الأذرع" الميكانيكية لإكمال مهمة. لوقت طويل، تم تعليم الروبوتات كل معالجة على حدة، لكن VLA تعد بالعالمية.
تخيل أنك تعطي الروبوت مهمة "أحضر لي تلك الكوب الحمراء"، وهو لا يقتصر على التعرف على الجسم، بل يبني مسار الحركة في الوقت الفعلي، مع الأخذ في الاعتبار العقبات. هذا هو الدوري الذي تلعب فيه مجموعة Ant Group الآن. الإثارة هنا هي أن Pi0.
5 من Physical Intelligence كان يعتبر المعيار الذهبي للنماذج الأساسية المفتوحة في الروبوتات. كان شيئاً مثل GPT-3 للمناولات. ومع ذلك، تؤكد مجموعة Ant Group أن تطويرها الجديد يتفوق على Pi0.
5 من حيث دقة تنفيذ الأوامر والقدرة على التكيف مع الظروف الجديدة. هذه ضربة خطيرة لكبرياء المهندسين الأمريكيين. لم تنسخ الشركة الصينية ببساطة البنية المعمارية؛ بل حسنت الطريقة التي يربط بها النموذج بيانات الرؤية بالإجراءات المادية، مما سمح بتحقيق حركات أكثر سلاسة ودقة.
لماذا هذا مهم الآن؟ نحن على أعتاب ازدهار الروبوتات الإنسانية الشكل. تصبح الأجهزة أرخص وأكثر سهولة، لكن المشكلة الرئيسية تظل البرمجيات — الذكاء العام الذي سيسمح للروبوت بمغادرة المختبر المعقم والدخول إلى مستودع حقيقي أو شقة سكنية. مجموعة Ant Group تراهن على الانفتاح.
بإطلاق النموذج كمصدر مفتوح، فهي تدعو فعلياً آلاف المطورين في جميع أنحاء العالم لاختبار وتحسين الكود الخاص بهم. هذه خطوة كلاسيكية: إذا لم تتمكن من الفوز من خلال براءات الاختراع المغلقة، فأنشئ معياراً سيستخدمه الجميع. من المثير للاهتمام مراقبة كيفية تحول مجموعة Ant Group نفسها.
بعد كل الاضطرابات التنظيمية في الصين، تبحث الشركة عن نقاط ارتكاز جديدة، والتكنولوجيات العميقة (DeepTech) تبدو كملاذ مثالي. الروبوتات ليست فقط ضجة إعلامية، بل سوق ضخمة لأتمتة اللوجستيات، التي تمتلكها الصين أكثر من أي مكان آخر. من الممكن أن يكون نموذج VLA الخاص بهم قد تم تدريبه في الأصل على بيانات من مستودعات Alibaba الحقيقية، مما يعطيه ميزة هائلة على النماذج المدربة في المحاكاة.
هناك طبقة أخرى مهمة في هذه القصة — الطبقة الجيوسياسية. بينما تفرض الولايات المتحدة عقوبات على الرقائق، تستجيب الصين برفعة في الخوارزميات. النموذج المفتوح بمثل هذا التعقيد هو أداة قوية للتأثير.
إذا غداً استخدمت كل شركة ناشئة ثانية لتصنيع الروبوتات في أوروبا أو آسيا قاعدة من مجموعة Ant Group، فإن السؤال حول أي نظام بيئي فاز يصبح لاغياً. نحن نشهد انتقال الصراع على الريادة في الذكاء الاصطناعي من محادثات النصوص إلى العالم المادي. النقطة الأساسية: لقد وضعت مجموعة Ant Group سابقة خطيرة بإطلاق نموذج يتفوق على النظائر الغربية في الوصول المفتوح.
هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟
AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.