3DNews AI→ المصدر

Google Gemini: هاتفك الذكي الآن ملك رسمي للشبكة العصبية

هل تتذكر ذلك الشعور عندما طلبت من مساعد جوجل ضبط مؤقت زمني، فبدلاً من ذلك فتح بحثاً عن العبارة "ضبط مؤقت زمني"؟ يبدو أن عصر هذا العجز الساحر يقترب من نهايته…

معالج بواسطة الذكاء الاصطناعي من 3DNews AI؛ بتحرير Hamidun News
Google Gemini: هاتفك الذكي الآن ملك رسمي للشبكة العصبية
المصدر: 3DNews AI. كولاج: Hamidun News.
◐ استمع للمقال

هل تتذكر ذلك الشعور عندما طلبت من مساعد جوجل ضبط مؤقت زمني، فبدلاً من ذلك فتح بحثاً عن العبارة "ضبط مؤقت زمني"؟ يبدو أن عصر هذا العجز الساحر يقترب من نهايته. بينما كنا نناقش ما إذا كان بإمكان ChatGPT التفكير في معنى الحياة، كانت الأعمال تغلي في أعماق جوجل على شيء أكثر واقعية وفي نفس الوقت مخيف. نحن نتحدث عن مشروع أسترا، والذي تم اكتشاف آثاره مؤخراً في رمز آخر تحديثات جوجل. باختصار: هاتفك الذكي يتوقف عن كونه مجرد مجموعة من الرموز ويصبح عضواً تنفيذياً لنموذج جيميني.

دعنا نتذكر السياق. في آخر مؤتمر I/O، عرضوا علينا عرضاً توضيحياً حيث رأت الذكاء الاصطناعي العالم من خلال كاميرا نظارة، وتعرفت على الرموز البرمجية على لوحة بيضاء، وتذكرت مكان ترك المستخدم النظارة. بدا الأمر وكأنه سحر، لكن السؤال الرئيسي ظل خارج الكاميرا: هل ستتمكن هذه الأداة من الضغط على زر "شراء" أو "حجز" بمفردها؟ تؤكد الاكتشافات الأخيرة في الكود أن جوجل تخطط لمنح جيميني حقوق المسؤول على واجهة المستخدم الخاصة بك. هذه خطوة منطقية في التطور من نماذج اللغات الكبيرة إلى نماذج الإجراءات. لقد قضينا سنوات في تعليم الشبكات العصبية الكلام؛ الآن حان وقت تعليمها العمل.

لماذا يحدث هذا الآن؟ تقف جوجل في موقع المتتبعة من حيث ذكاء النماذج "البحت"، لكن الشركة تمتلك أوراقاً رابحة لا تمتلكها لا OpenAI ولا Anthropic. إنه نظام أندرويد. بفضل الوصول العميق إلى واجهات برمجة التطبيقات النظامية، يمكن لجوجل السماح لجيميني برؤية ما يحدث على الشاشة في أي تطبيق ومحاكاة ضغطات المفاتيح. بينما تعد Apple فقط بشيء مشابه من خلال نظام الذكاء الخاص بها، تقوم جوجل بالفعل بوضع الأساس لكي يتمكن هاتفك من التخطيط المستقل لمساء: من حجز طاولة في مطعم إلى طلب سيارة أجرة في الوقت المناسب، متجاوزاً مرحلة مشاركتك الشخصية في تصفح القائمة.

تقنياً، يتم تنفيذ هذا من خلال تحليل تدفق المرئيات. لا تقرأ جيميني النص فقط؛ بل تفهم الهرمية لعناصر الواجهة. تعرف أن سلة التسوق الصغيرة في الزاوية هي الانتقال إلى الدفع، وأن هذا الرمز × يغلق الإعلان. هذا يزيل عبئاً ضخماً عن المستخدم، لكنه في نفس الوقت يفتح صندوق باندورا من حيث الأمان. تخيل وكيل ذكاء اصطناعي أكد بالخطأ أو بسبب هلوسة تحويل أموال أو حذف دردشة عمل مهمة. لهذا السبب تقوم جوجل بتطبيق هذه الميزات بحذر، مخفيةً إياها خلف طبقات من الرموز حتى يصبح النظام موثوقاً بما يكفي.

تقف الصناعة الآن على عتبة "ثورة الوكلاء". شهدنا بالفعل محاولات لإنشاء أجهزة منفصلة لهذا الغرض، مثل Rabbit R1 أو Humane Pin، لكنها فشلت تماماً لأنها حاولت استبدال الهاتف الذكي. جوجل تتصرف بذكاء أكثر: تحول الشركة الطوبة الموجودة بالفعل في جيبك إلى مساعد مستقل. هذا يغير نموذج استخدام الجهاز نفسه. يتوقف الهاتف الذكي عن كونه جهازاً تنظر إليه لساعات ويصبح معالجاً في الخلفية ينفذ مهامك. إذا نجح الأمر، فإن المفهوم نفسه "للتطبيق" قد يصبح من الماضي—لماذا تحتاج لفتح واجهة Uber إذا قام جيميني بكل شيء عبر واجهة برمجية أو التقاط الشاشة؟

في النهاية، هذه معركة على وقتنا. تدرك جوجل أنه إذا لم تجعل جيميني مشغلاً كاملاً لنظام أندرويد، فسيفعله شخص آخر من خلال حلول بديلة وملحقات. الآن نرى الخطوات الأولى المتردية لنظام سيعرف قريباً هيكل تطبيقاتك أفضل منك أنت نفسك. لا يسعنا سوى الأمل بألا تقرر جيميني أن وجودك في عملية اختيار البيتزا هو أيضاً ضوضاء زائدة يستحق القضاء عليها.

النقطة الرئيسية: هل سيصبح جيميني "الطيار الآلي" الكامل لنظام أندرويد بالفعل في هذا العام، أم أننا بانتظار سلسلة أخرى من الاختبارات التجريبية التي لا تنتهي؟

ZK
Hamidun News
أخبار الذكاء الاصطناعي بدون ضوضاء. اختيار تحريري يومي من أكثر من 400 مصدر. منتج من جمال حميدون، رئيس الذكاء الاصطناعي في Alpina Digital.

هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟

AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.

ما رأيك؟
جارٍ تحميل التعليقات…