MIT Technology Review→ المصدر

تجمع Micro1 مقاطع فيديو منزلية من حول العالم لتدريب الروبوتات الإنسانية الشكل

تحول تدريب الروبوتات الإنسانية الشكل بشكل غير متوقع إلى قطاع جديد في اقتصاد العمل المؤقت. تدفع Micro1 وشركات أخرى للأشخاص في نيجيريا والهند ودول أخرى مقابل…

معالج بواسطة الذكاء الاصطناعي من MIT Technology Review؛ بتحرير Hamidun News
تجمع Micro1 مقاطع فيديو منزلية من حول العالم لتدريب الروبوتات الإنسانية الشكل
المصدر: MIT Technology Review. كولاج: Hamidun News.
◐ استمع للمقال

صادف تدريب الروبوتات الإنسانية الشكل عقبات ليس فقط في الميكانيكا والرقائق، بل أيضاً في نقص البيانات الحقيقية عن كيفية تحرك الإنسان والتعامل مع الأشياء في المنزل. لهذا السبب، يشهد السوق الجديد نمواً سريعاً حول الصناعة: آلاف العاملين بنظام العمل المؤقت يسجلون كي الملابس والتنظيف والطهي في المنزل، ثم تصبح هذه مقاطع فيديو بيانات تدريبية للروبوتات.

كيفية عمل السوق

أحد هؤلاء العاملين هو زيوس، طالب طب من نيجيريا. بعد انتهاء نوبته في المستشفى، يشغل مصباح الحلقة، ويثبت جهاز iPhone على جبينه، ويسجل الإجراءات اليومية من منظور الشخص الأول. تجمع ميكرو1، وهي شركة من بالو ألتو، مثل هذه مقاطع الفيديو من المقاولين في أكثر من 50 دولة، بما في ذلك الهند ونيجيريا والأرجنتين، ثم تبيعها لشركات الروبوتات. يتم فحص المرشحين أولاً بواسطة مساعد ذكاء اصطناعي، وتمر مقاطع الفيديو نفسها عبر التحقق التلقائي واليدوي قبل الوسم.

  • طي الملابس والكي
  • غسل الأطباق وتنظيف المطبخ
  • الطهي والعمل مع الأدوات
  • نقل الأشياء حول الغرفة
  • الملاحة البسيطة في المساحات المنزلية الضيقة

ظاهرياً، يبدو هذا عملاً جانبياً بسيطاً جداً: تحتاج إلى التحرك بشكل طبيعي والحفاظ على يديك في الإطار وتكرار الإجراءات المنزلية المألوفة. لكن في مثل هذه مقاطع الفيديو بالتحديد يتعلم النموذج فهم قبضة الأشياء والتغييرات في موضع الجسم والسيناريوهات الأساسية للتفاعل مع الأشياء. بالنسبة لبعض العاملين، هذا دخل لائق: يتقاضى زيوس حوالي 15 دولاراً في الساعة. في الوقت نفسه، يصبح العمل رتيباً بسرعة، وفي شقة صغيرة من الصعب الخيال بمشاهد وتنويعات جديدة كافية.

لماذا تحتاج الروبوتات إلى هذا

نما الازدهار الأخير في الروبوتات إلى حد كبير من نجاح نماذج اللغة الكبيرة. منطق الصناعة بسيط: إذا تعلم روبوتات الدردشة من أحجام ضخمة من النصوص، فيمكن تدريب الروبوتات الإنسانية أيضاً على أحجام كبيرة من بيانات الحركة. المشكلة هي أن العالم المادي أكثر تعقيداً بكثير من الإنترنت. تعمل المحاكاة بشكل معقول للمشي أو حيل العرض، لكنها تفشل في التقاط قوة الضغط والاحتكاك والحركات غير الدقيقة وفوضى المطبخ والغرفة والمستودع الحقيقية.

وفقاً لرئيس ميكرو1 علي أنصاري، تنفق شركات الروبوتات بالفعل أكثر من 100 مليون دولار سنوياً على شراء البيانات الحقيقية. في عام 2025، استثمر المستثمرون أكثر من 6 مليارات دولار في الروبوتات الإنسانية الشكل، وليس فقط ميكرو1 تبحث عن مثل هذه البيانات: تطور شركات مثل Scale AI و Encord برامج مماثلة، تدفع DoorDash المندوبين لتصوير المهام المنزلية، وفي الصين يتم تعليم العاملين الحركات من خلال سماعات الواقع الافتراضي والهياكل العظمية الخارجية في مراكز متخصصة. حتى مع هذا الحجم، السوق لا يزال يبني البنية التحتية لجمع البيانات.

"سيستغرق هذا وقتاً أطول مما يعتقد الكثيرون." هذا التقييم، الذي يشاركه

خبراء الروبوتات في المادة أيضاً، يصف جيداً الحالة الحالية للسوق وتوقعات الصناعة. حتى عشرات ومئات الآلاف من ساعات الفيديو لا تبدو بعد حجماً كافياً للروبوتات العالمية الحقيقية. لا تزال الصناعة تحتاج إلى معرفة البيانات المفيدة فعلاً، وكم عدد الاختلافات المطلوبة للتدريب الموثوق به، وما إذا كان من الممكن جمع مثل هذا الحجم دون زيادة حادة في التكاليف وانخفاض الجودة.

حيث تبدأ المخاطر

المشكلة الأكثر وضوحاً هي الخصوصية. تطلب الشركات عدم إظهار الوجوه والأسماء وأرقام الهاتف والمعرفات الواضحة الأخرى. لكن حتى بدونها، تلتقط مقاطع الفيديو بداخل الشقة والممتلكات الشخصية والعادات والأطفال والجيران والروتين اليومي. بالنسبة للعاملين الذين لديهم أسر، تكون المهمة غير مريحة بشكل خاص: يجب أن تراقب باستمرار للتأكد من عدم ظهور طفل أو جار في الإطار. نتيجة لذلك، تصبح "بيانات الروبوت" تسجيلاً تفصيلياً جداً لحياة شخص آخر اليومية.

هناك مشكلة ثانية أيضاً—الجودة والشفافية لسلسلة كاملة. يفهم العاملون المستجوبون أنهم يساعدون في تدريب الروبوتات، لكنهم في كثير من الأحيان لا يعرفون كيف سيتم تخزين التسجيلات ومن سيتم تسليمها إليهم وما إذا كان يمكنهم لاحقاً الحصول على حذفها. محترفو الروبوتات، في الوقت نفسه، يحذرون من أن العادات المنزلية ليست آمنة دائماً ولا تكون مناسبة دائماً كنموذج للآلة. إذا امتص الروبوت أنماطاً فاشلة من مقاطع الفيديو المنزلية، ستظهر الأخطاء في العمل الحقيقي، والتحكم في هذا مع تدفق مقاطع الفيديو من آلاف الأشخاص يكون صعباً جداً.

ما يعنيه هذا

يُدعم ازدهار الروبوتات الإنسانية الشكل اليوم ليس فقط بنماذج وأجهزة جديدة، بل بسوق مخفية للعمل اليدوي الذي يزود الصناعة ببيانات عن الحياة اليومية. إذا أرادت الشركات نقل الروبوتات المنزلية والصناعية إلى التبني الجماعي، فسيتعين عليها حل ليس فقط مشكلة التدريب، بل أيضاً مسائل الموافقة والخصوصية وجودة البيانات. خلاف ذلك، ستكون "الميل الأخير" للأتمتة أطول بكثير مما تعد به العروض التقديمية.

ZK
Hamidun News
أخبار الذكاء الاصطناعي بدون ضوضاء. اختيار تحريري يومي من أكثر من 400 مصدر. منتج من جمال حميدون، رئيس الذكاء الاصطناعي في Alpina Digital.

هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟

AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.

ما رأيك؟
جارٍ تحميل التعليقات…