Google Gemini يتعلم توليد نماذج ثلاثية الأبعاد تفاعلية ومحاكاة
أضافت Google إلى Gemini القدرة على توليد نماذج ثلاثية الأبعاد تفاعلية ومحاكاة فيزيائية مباشرة استجابة لأسئلة المستخدمين. يمكن تدوير النماذج وتعديل المنزلقات…
معالج بواسطة الذكاء الاصطناعي من The Verge؛ بتحرير Hamidun News
قامت شركة غوغل بتحديث جيميني: الآن يمكن لمساعد المحادثة أن ينشئ نماذج ثلاثية الأبعاد تفاعلية ومحاكاات فيزيائية مباشرة في الحوار. يكفي طرح سؤال — وبدلاً من نص ثابت أو صورة، ينشئ النظام كائناً يمكنك التفاعل معه في الوقت الفعلي. هذا أحد أبرز التوسعات في صيغ الاستجابة في نماذج اللغات الكبيرة على مدار الأشهر الأخيرة.
تعمل الميزة بالطريقة التالية: استجابة لطلب ما، ينشئ جيميني نموذجاً ثلاثي الأبعاد مع مجموعة من العناصر التحكمية التفاعلية. يمكن للمستخدم تدوير الكائن بالفأرة، تحريك المنزلقات، إدخال قيم رقمية — ورؤية على الفور كيف يتغير سلوك النظام. لا توجد عمليات تحميل، ولا انتقالات إلى خدمات تابعة لجهات خارجية، ولا انتظار للعرض: كل شيء يحدث داخل واجهة الدردشة، بدون أي أدوات إضافية.
هذا اختلاف أساسي عن الحالات التي كان فيها مساعد المحادثة ينشئ ببساطة رابطاً لمحاكاة خارجية أو يقدم تحميل ملف. اختبر محرر من The Verge هذه الميزة بمثال محدد. طلب من جيميني بناء محاكاة قمر يدور حول الأرض — بدون أي رمز أو إعداد مسبق.
أنشأ مساعد المحادثة مشهداً ثلاثي الأبعاد مع عدة أدوات تحكم: منزلق لتعديل سرعة المدار، مفتاح تبديل للتحكم في ظهور مسار المدار وزر إيقاف مؤقت. عملت الفيزياء بشكل صحيح، تحركت الكائنات بسلاسة، واستجابت جميع عناصر التحكم على الفور. كان مثل هذا النتيجة يتطلب سابقاً عمل المبرمج والبرامج المتخصصة.
حتى الآن، كان مساعدو المحادثة التوليديون يتعاملون بشكل أساسي مع النص والرمز والصور. المحاكاات التفاعلية هي مستوى مختلف نوعياً: فهي تتطلب ليس فقط رسم كائن، بل توليد منطق العمل لسلوكه، بما في ذلك الفيزياء والاستجابة لمدخلات المستخدم. بشكل أساسي، يعمل جيميني الآن ليس فقط كمولد محتوى، بل كمنشئ أدوات تعليمية وبحثية في الوقت الفعلي، بدون إشراك المطورين.
تطبيق هذه الصيغة من الاستجابة واضح في عدة مجالات. في التعليم: بدلاً من قراءة وصف مدارات الكواكب، يمكن للطالب تحريك منزلق ورؤية كيف يؤثر تغيير السرعة على المسار. في الهندسة — تصور سريع لآلية أو عملية فيزيائية بدون تشغيل برامج متخصصة مثل MATLAB أو SolidWorks.
في الطب — فحص هيكل تشريحي من جميع الزوايا. في التصميم — تقييم شكل كائن بثلاثة أبعاد مباشرة أثناء النقاش، بدون مغادرة الحوار. لم تكشف غوغل بعد عن التفاصيل التقنية حول كيفية قيام جيميني بتوليد منطق المحاكاات بالضبط — سواء كان يكتب رمزاً تحت الغطاء باستخدام WebGL أو Three.
js أو يستخدم نهجاً مختلفاً. لم يتم الإعلان عن المنهجية ولا القيود على أنواع الكائنات المدعومة رسمياً. ومع ذلك، من وجهة نظر المستخدم النهائي، تفاصيل التنفيذ ليست ضرورية: ما يهم هو النتيجة، وهي تبدو مقنعة بالفعل في مرحلة المظاهر الأولى.
يندرج هذا التحديث ضمن اتجاه تنافسي أوسع. تتنافس المختبرات الكبيرة للذكاء الاصطناعي ليس فقط على دقة الاستجابات النصية، بل أيضاً على ثراء صيغ المخرجات. أطلقت OpenAI Canvas للتحرير التعاوني للمستندات والرمز، وتطور Anthropic القطع الأثرية مع HTML التفاعلي، والآن تضيف غوغل المحاكاات ثلاثية الأبعاد والفيزيائية.
تتحول مساعدو المحادثة تدريجياً من مساعدات نصية إلى بيئات عمل متعددة الصيغ. بالنسبة لمستخدمي جيميني، يعني هذا قدرات موسعة بدون الحاجة إلى مهارات تقنية إضافية. هل تريد فهم كيفية عمل البندول — اسأل.
هل تريد رؤية جزيء بثلاثة أبعاد — اسأل أيضاً. هل تريد مقارنة سلوك نوابضين مختلفين — حدد المعاملات وراقب. الحد بين سؤال وكتاب مدرسي تفاعلي يستمر في الاندثار، والمحاكاات ثلاثية الأبعاد هي واحدة من أوضح تأكيدات ذلك.
هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟
AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.