SIMA 2 من DeepMind: أول وكيل ذكي مفكر للألعاب الفيديو والروبوتات
قدمت DeepMind SIMA 2 وكيلاً تطور من المنفذ الطائع إلى رفيق تفاعلي حقيقي. لا يقتصر الوكيل على تنفيذ الأوامر فحسب، بل يفكر في الأهداف ويحاور المستخدم ويحسن من…
معالج بواسطة الذكاء الاصطناعي من DeepMind Blog؛ بتحرير Hamidun News
قدمت DeepMind SIMA 2 وكيلاً للعوالم الثلاثية الأبعاد الافتراضية، تطور من اتباع التعليمات البسيط إلى مساعد تفاعلي قادر على التفكير والحوار والتحسن الذاتي. يمثل هذا تقدماً كبيراً نحو مستوى جديد من الذكاء الاصطناعي.
من الطاعة إلى التفكير
قبل عام، أطلقت DeepMind SIMA الأولى، وكيلاً يمكنه تنفيذ أكثر من 600 مهارة في الألعاب الفيديو: "استدر لليسار"، "اصعد السلم"، "افتح الخريطة". كان الوكيل يعمل مثل الإنسان ينظر إلى الشاشة ويتحكم بلوحة المفاتيح الافتراضية والفأرة، دون الوصول إلى الميكانيكا الداخلية للألعاب.
SIMA 2 قفزة نوعية في البنية المعمارية. يستند الآن إلى نموذج Gemini، الذي يمنح الوكيل قدرة حقيقية على التفكير. هذا يعني أنه بدلاً من تنفيذ أمر بسيط مثل "ابحث عن النار"، يمكن للوكيل الآن فهم الهدف عالي المستوى وتقسيمه إلى مهام فرعية وتحليل البيئة والتخطيط للإجراءات.
ما يستطيع SIMA 2 فعله
تم تدريب الوكيل على نوعين من البيانات: تسجيلات فيديو لتصرفات الإنسان الحقيقية مع تعليقات مفصلة والعلامات التي تم إنشاؤها تلقائياً بواسطة Gemini. سمح هذا النهج الهجين SIMA 2 بتطوير قدرات جديدة:
• تقسيم الهدف المعقد للمستخدم إلى خطوات منطقية وتنفيذها بالتسلسل الصحيح • شرح نواياه والتفكير في كل إجراء • الإجابة على أسئلة التوضيح من المستخدم والتفاعل في حوار • التعلم من أخطاؤه والتحسن مع كل محاولة • نقل المهارات إلى ألعاب جديدة تماماً لم يرها الوكيل من قبل
في العروض التوضيحية، وجدت SIMA 2 بنجاح النار في ألعاب غير مألوفة، حيث تعطلت النسخة الأولى ببساطة. يعمم الوكيل فهماً مجرداً للمهمة بدلاً من تكرار الأوامر المحفوظة ميكانيكياً.
نحو الروبوتات الفيزيائية
تؤكد DeepMind أن هذا البحث يتجاوز بكثير حدود الألعاب الفيديو. بنية SIMA 2 رؤية الشاشة والتفكير في الأهداف وتنفيذ الإجراءات من خلال التحكم بالواجهة، هذا بالضبط ما هو مطلوب لتطوير الروبوتات الحقيقية.
في العالم الفيزيائي، سيستخدم الروبوت الكاميرا بدلاً من الشاشة، لكن المهمة تبقى كما هي: فهم البيئة والتخطيط للإجراء والتفاعل مع الأشياء.
كان SIMA الأول يوضح بالفعل نقل التعلم من الألعاب الفيديو إلى محاكيات الواقع. SIMA 2 بقدرتها على التفكير، يجب أن تكون أداة أكثر عالمية للروبوتات. يسمي المطورون هذا خطوة كبيرة نحو AGI الذكاء الاصطناعي العام. كانت مشكلة التعميم تطبيق ما تم تعلمه في حالات جديدة تماماً حجر عثرة في الذكاء الاصطناعي لسنوات. يوضح SIMA 2 تقدماً ملموساً في حلها: يمكن للوكيل التكيف مع البيئات والأهداف غير المألوفة.
ماذا يعني هذا
الحدود بين الذكاء الاصطناعي الضيق الموجه للمهام والتفكير العام تتلاشى. SIMA 2 ليس مجرد منفذ أوامر، بل هو مساعد تفاعلي يفهم السياق ويمكنه مناقشة الاستراتيجية والتعلم أثناء التقدم. بالنسبة للروبوتات، هذا يعني أن التقنيات الرئيسية الرؤية والتفكير والتكيف قريبة بالفعل من التطبيق العملي.
هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟
AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.