Project Genie من DeepMind تتعلم محاكاة الأماكن الحقيقية في Google Street View
وسعت DeepMind نطاق الوصول إلى نموذج Project Genie التفاعلي لجميع مشتركي Google AI Ultra في جميع أنحاء العالم. الخبر الرئيسي هو التكامل مع Google Street View: يم
معالج بواسطة الذكاء الاصطناعي من DeepMind Blog؛ بتحرير Hamidun News
وسعت DeepMind نطاق الوصول إلى Project Genie لجميع مشتركي Google AI Ultra في جميع أنحاء العالم وقدمت إمكانية تكامل جديدة مع Google Street View، التي تسمح بمحاكاة مقاطع فيديو تفاعلية للأماكن الجغرافية الحقيقية.
ما هو Project Genie
Project Genie هو نموذج فيديو توليدي متقدم من Google DeepMind ينشئ مشاهد فيديو تفاعلية بناءً على الأوصاف النصية أو الصور. على عكس مولدات الفيديو العادية التي تعيد ببساطة تشغيل محتوى مسجل مسبقاً، يبني Genie عالماً افتراضياً ديناميكياً يستجيب لتصرفات الوكيل في الوقت الفعلي. يمكن للنموذج أن يوضح شخصاً (أو روبوتاً) في المشهد يقوم بتصرفات مختلفة: المشي في اتجاهات مختلفة، ومعالجة الكائنات، والتفاعل مع البيئة. مع كل تصرف، يتم تحديث الفيديو، مما يعكس القوانين الفيزيائية والعلاقات السببية بين الأحداث. هذا يجعل التجربة تشبه إدارة شخصية لعبة في لعبة فيديو، لكنها تعتمد على تنبؤات الشبكة العصبية بدلاً من المواد المسجلة مسبقاً.
التكامل الجديد مع Street View
تجمع الميزة الجديدة قدرات Project Genie مع Google Street View - أرشيفاً ضخماً من الصور البانورامية لملايين الأماكن حول الكرة الأرضية. الآن، بدلاً من المشاهد الخيالية أو الاصطناعية، يمكن للوكيل التفاعل مع المواقع الحقيقية: المراكز التاريخية للمدن والحدائق والمساحات العامة والمعالم السياحية. هذا يحول Street View من معرض صور ثابت إلى عالم افتراضي تفاعلي. يمكن للمستخدم ليس فقط عرض صورة بانورامية لساحة القديس بطرس، بل حرفياً "التنزه" فيها، مستكشفاً التفاصيل المعمارية، والنظر في واجهات المتاجر، والتفاعل مع الكائنات، ورؤية كيفية تغير الصورة وفقاً لتصرفاته.
حيث يمكن أن يكون هذا مفيداً
تفتح محاكاة الفيديو التفاعلية للأماكن الحقيقية تطبيقات عملية عديدة:
- تخطيط السفر والسياحة - سيتمكن السياح من الاستكشاف الافتراضي للمعلم السياحي قبل الزيارة
- إعادة التأهيل والوصول - يمكن للأشخاص ذوي قيود الحركة استكشاف المساحات العامة عن بعد
- العمارة والتخطيط الحضري - سيتمكن المصممون من محاكاة كيفية دمج المباني الجديدة في المساحات الموجودة
- الروبوتات - ستتمكن الشبكات العصبية للروبوتات المستقلة من التدريب على سيناريوهات حضرية حقيقية
- التعليم والثقافة - ستصبح الجولات الافتراضية عبر الأماكن التاريخية تفاعلية بالكامل
كل واحد من هذه التطبيقات يتطلب من Genie مستوى عالي من الواقعية في التنبؤ بالعمليات الفيزيائية وسلوك الناس.
التحديات التقنية
يتطلب توليد فيديو تفاعلي حقيقي موارد حسابية ضخمة. يجب على النموذج ليس فقط التنبؤ بالإطارات التالية للفيديو بدقة عالية، بل القيام بذلك مع تأخير أدنى، بحيث يبدو التفاعل سلساً وحقيقياً. يمكن للأخطاء الصغيرة في التنبؤ بالفيزياء أو حركات الناس أن تتراكم بسرعة، مما يدمر الوهم بالواقعية.
توسيع نطاق الوصول
في السابق، كان Project Genie متاحاً فقط لعدد محدود من المستخدمين. الآن توسع Google نطاق الوصول لجميع مشتركي Google AI Ultra في جميع أنحاء العالم. هذا سيسمح لعدد أكبر من المطورين والباحثين والمتحمسين بتجربة توليد الفيديو التفاعلي للأماكن الحقيقية. يشير توسيع الوصول إلى هذه التكنولوجيا المتقدمة إلى أن النموذج قد حقق مستوى معيناً من الاستقرار والاستعداد للاستخدام في التطبيقات الحقيقية.
ماذا يعني هذا
يتلاشى الحد الفاصل بين المعلومات الثابتة (الصور والفيديو والخرائط) والمحاكاة التفاعلية للذكاء الاصطناعي تدريجياً. Project Genie جنباً إلى جنب مع Street View يمثل خطوة كبيرة نحو إنشاء "واقع تفاعلي بديل" بناءً على بيانات جغرافية حقيقية. في المستقبل، سيتمكن الناس ليس فقط من النظر إلى الأماكن، بل استكشافها بنشاط، والتفاعل مع الكائنات والبيئة، وتدريب أنظمة الذكاء الاصطناعي بناءً على المحاكاة. هذا يغير بشكل أساسي كيفية استهلاكنا للمعلومات حول العالم وتفاعلنا مع المساحة الجغرافية.
هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟
AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.