Jiqizhixin (机器之心)→ المصدر

SplatSSC: تعلمت Gaussian Splatts إعادة بناء الواقع من صورة واحدة

تعاني الروبوتات والمركبات المستقلة منذ فترة طويلة من الرؤية "المسطحة". لفهم ما يختبئ خلف الزاوية أو مدى امتداد الممر بالعمق، كانوا يحتاجون إما إلى التجهز…

معالج بواسطة الذكاء الاصطناعي من Jiqizhixin (机器之心)؛ بتحرير Hamidun News
SplatSSC: تعلمت Gaussian Splatts إعادة بناء الواقع من صورة واحدة
المصدر: Jiqizhixin (机器之心). كولاج: Hamidun News.
◐ استمع للمقال

تعاني الروبوتات والمركبات المستقلة منذ فترة طويلة من الرؤية "المسطحة". لفهم ما يختبئ خلف الزاوية أو مدى امتداد الممر بالعمق، كانوا يحتاجون إما إلى التجهز بأجهزة استشعار ليدار مكلفة أو إنفاق موارد حسابية ضخمة لمعالجة شبكات حجمية ثقيلة. في المؤتمر المرموق AAAI 2026، تم تقديم حل يمكن أن يحسم هذه القضية مرة واحدة وإلى الأبد. تجلب تقنية SplatSSC قوة تقنية Gaussian Splatting (ثلاثية الأبعاد) إلى عالم إكمال المشهد الدلالي (Semantic Scene Completion). الآن الذكاء الاصطناعي لا يعيد بناء الهندسة من صورة واحدة فحسب، بل يفهم أيضًا مكان وجود الكرسي والجدار والمساحة الفارغة التي يمكن استخدامها بأمان للمناورة.

كانت مشكلة الرؤية أحادية العين تصطدم دائمًا بنقص كارثي في بيانات العمق. عندما يكون لديك عدسة واحدة فقط في متناول اليد، يصبح تحديد المسافة الدقيقة إلى الأجسام مقامرة. في السابق، حاول الباحثون بناء شبكات ثلاثية الأبعاد كثيفة من البكسل، لكن هذا حول أي جهاز كمبيوتر إلى مدفأة محموم بسبب حجم البيانات الهائل.

تغير SplatSSC قواعد اللعبة باستخدام طريقة التحكم في العمق المفكوك. بدلاً من التخمين، تقسم الخوارزمية عملية التنبؤ بالهندسة والدلالات إلى تدفقين مستقلين لكن مترابطين. هذا يسمح للنظام بالتركيز على التفاصيل حيث تهم حقًا وعدم إهدار الموارد الثمينة على أجزاء فارغة من المساحة.

ما يجعل SplatSSC مثيرًا للاهتمام حقًا هو الانتقال الحاسم من البكسل الثقيل إلى نقاط غاوسية خفيفة. إذا كانت المشهد الرقمي في السابق يمثل مجموعة ضخمة من مكعبات ليغو، فهي الآن سحابة من إهليلجات أنيقة تصف بسلاسة أسطح أي تعقيد. هذا لا يوفر فقط ذاكرة الوصول العشوائي بشكل جذري، بل يحقق أيضًا دقة لا تصدق في تحديد حدود الكائنات. في سياق المركبات المستقلة، هذا يعني الفارق الحاسم بين "أرى عائقًا ضبابيًا ما" و "أرى حافة رصيف معينة وأفهم بوضوح ارتفاعها بالنسبة لسطح الطريق".

لم يقتصر الباحثون على إضافة اختصار معقد آخر إلى الكتب الأكاديمية. لقد حلوا مشكلة أساسية في دمج البيانات ثنائية الأبعاد في الفضاء ثلاثي الأبعاد. غالبًا ما فقدت الطرق التقليدية التفاصيل النسيجية الدقيقة عند محاولة تحويل البكسل إلى حجم. يحافظ SplatSSC على جميع المعلومات المهمة من خلال الإسقاط المباشر للبكسل غاوسي. هذا يعطي الخوارزمية القدرة على إعادة بناء حتى تلك الأجزاء من المشهد المحجوبة حاليًا بواسطة أجسام أخرى. ينهي النظام حرفياً الواقع بناءً على السياق البصري والأنماط المكتسبة مسبقًا، مما يفعل ذلك عدة مرات أسرع من أي منافس موجود.

لماذا هذا مهم الآن؟ نحن على عتبة اعتماد واسع النطاق للروبوتات المنزلية الشخصية وأنظمة الطيار الآلي منخفضة الميزانية. لا أحد يريد أن يدفع خمسة آلاف دولار إضافية للحصول على جهاز استشعار ليدار لمكنسة كهربائية آلية أو طائرة بدون طيار للتوصيل. يفتح SplatSSC مسارًا مباشرًا للملاحة المتقدمة باستخدام كاميرات عادية تكلف فلسًا واحدًا. إذا أكدت التقنية خصائصها المعلنة في ظروف العمل الحقيقية، فسنرى قفزة حادة في جودة الواقع المعزز والأنظمة المستقلة في السنوات القادمة. بالطبع، لا تزال هناك أسئلة حول التنفيذ على الأجهزة المحمولة، لكن الحقيقة البسيطة بأن كاميرا أحادية العين يمكنها الآن التنافس مع أنظمة الكاميرات المتعددة المكلفة مثيرة للإعجاب.

وجد الباحثون من AAAI وريدًا ذهبيًا في تحسين رؤية ثلاثية الأبعاد. الآن تقع المسؤولية على عاتق مصنعي المعالجات الذين يحتاجون إلى تكييف معمارية الشرائح مع حسابات Gaussian Splatting المحددة لتحويل هذا البرنامج إلى معيار صناعي. الأساس: يثبت SplatSSC أنه لفهم العالم ثلاثي الأبعاد، لا تحتاج إلى أجهزة استشعار مكلفة—فقط خوارزميات ذكية لمراقبة العمق المفكوك. هل يمكن لأجهزة استشعار ليدار أن تبقى على قيد الحياة في عالم حيث ترى كاميرا عادية بوضوح تقريبًا؟

ZK
Hamidun News
أخبار الذكاء الاصطناعي بدون ضوضاء. اختيار تحريري يومي من أكثر من 400 مصدر. منتج من جمال حميدون، رئيس الذكاء الاصطناعي في Alpina Digital.

هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟

AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.

ما رأيك؟
جارٍ تحميل التعليقات…