Google Genie 3: عندما تستبدل الشبكة العصبية محرك اللعبة (والواقع)
هل تتذكر ذلك الشعور الطفولي عندما نظرت إلى صورة في كتاب وأردت بيأس أن تدخل بداخلها؟ يبدو أن Google قررت جادة تحويل هذا الخيال إلى كود عملي. في حلقة حديثة من…
معالج بواسطة الذكاء الاصطناعي من Google AI Blog؛ بتحرير Hamidun News
هل تتذكر ذلك الشعور الطفولي عندما نظرت إلى صورة في كتاب وأردت بيأس أن تدخل بداخلها؟ يبدو أن Google قررت جادة تحويل هذا الخيال إلى كود عملي. في حلقة حديثة من البودكاست Google AI: Release Notes، ناقش لوغان كيلباتريك مشروع Genie 3 مع مهندسي DeepMind. هذا ليس مجرد شبكة عصبية أخرى لإنشاء قطط بأسلوب بيكسار. إنه نموذج عالم تفاعلي كامل يفهم ما الذي سيحدث إذا ضغطت على زر أو دفعت شيئاً ما.
دعنا نضع هذا في السياق. لفترة طويلة، كانت الصناعة مهووسة بجودة البكسل. أعجبنا بـ Sora من OpenAI أو Kling لأنهما ينتجان صوراً يصعب تمييزها عن الواقع. لكن لهذه النماذج مشكلة أساسية: فهي ببساطة "ملتقطات الفجوات" المتقدمة جداً. تعرف كيف يجب أن تبدو الإطار التالي، لكنها لا تفهم العلاقات السببية. إذا في فيديو Sora أخذ شخص عضة من بسكويت، قد تبقى البسكويت سليمة. Genie 3 تسير في طريق مختلف.
عمل فريق DeepMind سنوات لتعليم الذكاء الاصطناعي فهم الفيزياء من خلال مراقبة الفيديوهات. Genie 3 هي تتويج فكرة "نموذج العالم" (World Model). لا تقتصر على رسم الإطارات، بل تحاكي البيئة. تعطيها صورة واحدة أو وصفاً نصياً، وتنشئ مساحة يمكنك التنقل فيها. إنه كما لو كانت لعبة فيديو تُنشأ في الوقت الفعلي مع كل خطوة تخطوها، دون تدخل من المبرمجين أو مصممي الرسومات ثلاثية الأبعاد.
لماذا هذا مهم بشكل حرج الآن؟ لأننا وصلنا إلى سقف البيانات. لتدريب وكلاء أكثر ذكاءً أو السيارات المستقلة، نحتاج إلى بيانات أكثر مما يوجد على الإنترنت بأكمله. Genie 3 تسمح بإنشاء محاكاة لا نهائية وصحيحة فيزيائياً لتدريب شبكات عصبية أخرى. إنها "رمل" حيث يمكن للروبوتات أن تخطئ ملايين المرات في الثانية دون كسر مصغرات مكلفة في الواقع. Google بوضوح تراهن على أن مستقبل الذكاء الاصطناعي لا يكمن في بوتات الدردشة، بل في وكلاء يعملون في الفضاء.
بالطبع، هناك جرعة من السخرية هنا. بينما تطلق OpenAI و Anthropic منتجات يستخدمها الناس يومياً، تستمر Google في إطلاق البودكاستات والأوراق البحثية. نسمع عن القدرات المذهلة لـ Genie 3، لكن متى سنتمكن من تشغيلها على أجهزتنا؟ هذا السؤال يبقى مفتوحاً. ومع ذلك، التفوق التقني لـ DeepMind في معمارية هذه النماذج لا يقبل الجدل. إنهم يبنون الأساس الذي ستنمو عليه الجيل القادم من الذكاء الاصطناعي—نشط وليس سلبي.
الانتقال من "انظر ما رسمته" إلى "انظر ما حولت هذه الصورة إليه" هو تحول تكتوني. يغير كل شيء: من تطوير الألعاب، حيث ستُنشأ المستويات للاعب، إلى تدريب مساعدات الذكاء الاصطناعي في نسخ افتراضية من شققنا. تحاول Google إثبات أنها لا تزال الرائدة في الابتكار، حتى لو بدا مسارها نحو الإطلاق لا نهائياً.
النقطة الأساسية: Genie 3 تحول الذكاء الاصطناعي من فنان إلى معمار الواقعيات. هل ستتمكن Google من تسويق هذا أسرع من أن ينسخ المنافسون الطريقة?
هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟
AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.