TechCrunch→ المصدر

AI-лаборатории платят XDOF за сбор обучающих данных для роботов — это грязная рутинная работа

Чтобы роботы научились двигаться и работать с объектами, нужны миллионы часов реальных демонстраций — так же, как LLM учились на интернете. Собирать эти…

معالج بواسطة الذكاء الاصطناعي من TechCrunch؛ بتحرير Hamidun News
AI-лаборатории платят XDOF за сбор обучающих данных для роботов — это грязная рутинная работа
المصدر: TechCrunch. كولاج: Hamidun News.
◐ استمع للمقال

يواجه الذكاء الاصطناعي المادي نفس المشكلة التي كانت ستوقف نماذج اللغة بدون الإنترنت المتراكم من البشرية: نقص بيانات التدريب. في الوقت الحالي، تحل المعامل هذه المشكلة يدويًا — وتدفع أموالاً حقيقية لشركات مثل XDOF لفعل ذلك.

لماذا لا توجد بيانات كافية

تعلمت نماذج اللغة الكبيرة التفكير على تريليونات من الكلمات التي تراكمت لدى البشرية على الإنترنت. الروبوتات المادية ليس لديها هذا المورد: الحركات، والقبض، والتوازن، والتعامل مع الأشياء الهشة — كل هذا يجب أن يُظهر مباشرة، مرارًا وتكرارًا، في عشرات السيناريوهات المختلفة. ساعة واحدة من العروض التوضيحية عالية الجودة تتطلب جهدًا كبيرًا: يضع المشغل بدلة الهيكل الخارجي أو يتحكم بالروبوت عبر عصا التحكم، ويؤدي نفس الحركة مئات المرات تحت إضاءة مختلفة، مع أشياء مختلفة، في أوضاع مختلفة.

تصبح البيانات باهظة الثمن وبطيئة وتابعة بشدة للفضاء المادي. الإنترنت لن يساعد هنا. لهذا السبب، فإن الفرق الرائدة في مجال الذكاء الاصطناعي المادي — من Physical Intelligence إلى المختبرات داخل Google DeepMind ومطوري الروبوتات الإنسانية — واجهت جدارًا واحدًا: يمكن تحسين النماذج بلا حدود، لكن بدون حجم كافٍ من العروض التوضيحية عالية الجودة، فإنها لن تتعلم.

ماذا تفعل XDOF

XDOF هي إحدى الشركات التي تعاقد معها معامل الذكاء الاصطناعي لإسناد هذا العمل. يقومون بتنظيم العملية برمتها: تعيين المشغلين، وإعداد المعدات، ومراقبة جودة الوسم، وتوسيع الإنتاج لتلبية احتياجات عملاء محددين. يشبه النموذج الأيام الأولى من Scale AI، التي وظفت جيشًا من المعلقين لوسم النصوص والصور. إلا أنها الآن تتعلق بالعمل المادي في فضاء حقيقي.

تبدو جلسة جمع البيانات النموذجية كالتالي:

  • يتحكم المشغل بالروبوت يدويًا — يلتقط النظام مسارات الحركة وبيانات القوة
  • تقوم عدة كاميرات بالتقاط المشهد من زوايا مختلفة في نفس الوقت
  • يتم وسم كل محاولة: نجاح، فشل، حالة حدية
  • يتكرر السيناريو تحت إضاءة مختلفة، مع أشياء مختلفة، وفي أوضاع مختلفة
  • تصفية التحقق النهائي العروض التوضيحية المعيبة

هذا العمل لا يتطلب تعليمًا هندسيًا، لكنه يتطلب الانتباه والصبر والقدرة على التحمل الجسدي — هذا هو بالضبط ذلك "العمل القذر والمكروه" الذي تحذر منه الصناعة.

من يدفع ولماذا هذا مهم

إن توسيع نطاق جمع البيانات يصطدم بالفيزياء: لا يمكنك تنزيل ملايين الحركات الروبوتية من الشبكة، ولا يمكنك استبدالها ببيانات اصطناعية دون المخاطرة بتدهور النموذج. يسمح الإسناد للمعامل بالتركيز على العمارة والتدريب بينما يتعامل المتخصصون مع الروتين. جنبًا إلى جنب مع ذلك، ينشأ نوع جديد من "العمل المخفي" في صناعة الذكاء الاصطناعي — غير مرئي للجمهور العام لكنه حرج في غاية الأهمية. بالقياس على إشراف المحتوى لنماذج اللغة الكبيرة، سيزدهر سوق جمع العروض التوضيحية الروبوتية بسرعة — وسيصبح بسرعة في مركز النقاشات حول ظروف العمل ومعايير الجودة.

ماذا يعني هذا

ستتطلب حقبة الذكاء الاصطناعي المادي نفس البنية التحتية لجمع البيانات التي أنشأتها الإنترنت لنماذج اللغة. الشركات التي ستبني أولاً خطوط أنابيب فعالة لجمع وتوسيم العروض التوضيحية المادية ستحصل على ميزة هيكلية — بغض النظر عن من يطور النماذج نفسها.

ZK
Hamidun News
أخبار الذكاء الاصطناعي بدون ضوضاء. اختيار تحريري يومي من أكثر من 400 مصدر. منتج من جمال حميدون، رئيس الذكاء الاصطناعي في Alpina Digital.

هل تحتاج إلى ذكاء اصطناعي يعمل داخل شركتك — وليس فقط في موجز الأخبار؟

أبني ذكاءً اصطناعياً جاهزاً للإنتاج للشركات — أنظمة CRM مخصّصة، أدوات داخلية، وكلاء مستقلون، أتمتة سير العمل. ملك لك، مصمّم وفق عمليتك، دون رسوم لكل مستخدم. من إعداد جمال خميدون، مدير المنتجات في AlpinaGPT (منصة ذكاء اصطناعي، أكثر من 6000 مستخدم).

ما رأيك؟
جارٍ تحميل التعليقات…