3DNews AI→ المصدر

Google Gemini 3.5 Flash أصبح قادراً على التحكم بالحاسوب بدلاً من المستخدم

أضافت Google إلى Gemini 3.5 Flash ميزة Computer Use — وبات النموذج يتحكم بالحاسوب بدلاً من المستخدم: ينقر على الشاشة، ويملأ النماذج، ويتنقل بين التطبيقات…

معالج بواسطة الذكاء الاصطناعي من 3DNews AI؛ بتحرير Hamidun News
Google Gemini 3.5 Flash أصبح قادراً على التحكم بالحاسوب بدلاً من المستخدم
المصدر: 3DNews AI. كولاج: Hamidun News.
◐ استمع للمقال

حصلت Google Gemini 3.5 Flash على ميزة Computer Use — القدرة على التحكم المستقل في الكمبيوتر: الضغط على الأزرار وملء النماذج والتبديل بين التطبيقات وتنفيذ مهام متعددة الخطوات دون تدخل بشري. تضع Google موضعها كأداة للمؤسسات لأتمتة العمليات التشغيلية، متاحة من خلال منصة Vertex AI السحابية.

كيف يعمل التحكم في الكمبيوتر

المبدأ يشبه عمل المشغل أمام الشاشة: يتلقى النموذج لقطة شاشة ويحلل الواجهة ويحدد الإجراء التالي—نقرة أو إدخال نص أو تمرير صفحة—ويكرر الدورة حتى اكتمال المهمة. يرى Gemini 3.5 Flash الشاشة بنفس الطريقة التي يراها الإنسان، لكنه يتصرف بسرعة أكبر وبدون إرهاق. اختيار إصدار Flash متعمد: إنه أسرع نموذج في سطر Gemini 3.5. بالنسبة لمهام الوكيل مع سلاسل طويلة من الإجراءات المتسلسلة، تكون سرعة الاستجابة حاسمة—يتراكم التأخير في الوكيل البطيء مع كل خطوة، وتتحول سيناريوهات مثل أتمتة عشرات النماذج إلى عمليات تستغرق ساعات. يحل Flash هذه المشكلة من خلال الكمون المنخفض.

من بين الإمكانيات المعلنة:

  • التنقل في المتصفح والتفاعل مع نماذج الويب
  • التحكم في تطبيقات سطح المكتب من خلال GUI
  • تنفيذ المهام متعددة الخطوات دون تدخل المستخدم
  • التشغيل من خلال Vertex AI مع التحكم في الوصول للمؤسسة
  • تسجيل الإجراءات للتدقيق والامتثال الأمني

لمن هذا وكيفية الحصول على الوصول

تقسم Google تطوير Gemini إلى اتجاهين. الأول هو التكامل العميق مع Workspace: مساعد ذكي في Gmail و Docs و Sheets و Slides يساعد جمهوراً واسعاً بدون معرفة تقنية خاصة. الثاني هو إمكانيات الوكيل لقطاع المؤسسات، التي ينتمي إليها Computer Use. تتوفر الميزة من خلال Vertex AI—منصة Google السحابية للمؤسسات. ستتمكن الشركات من دمج الوكلاء في عملياتها الخاصة: أتمتة العمل مع الأنظمة القديمة بدون APIs، تفويض العمليات الروتينية للمتصفح إلى فريق التمويل أو الموارد البشرية، وبناء أدوات داخلية بناءً على Gemini مع الإدارة والتسجيل المركزيين.

من المهم أن نفهم أن Computer Use ليس مجرد "كاشف نقرة تلقائي". نحن نتحدث عن سيناريو وكيل كامل حيث يخطط النموذج بشكل مستقل سلسلة من الخطوات ويتكيف مع النتائج: إذا تم تحميل الصفحة بتأخير أو ظهرت نافذة منبثقة غير متوقعة—يراها الوكيل ويرد عليها.

المنافسة على التحكم بالشاشة

أصبح سوق وكلاء الذكاء الاصطناعي الذين يعملون مع واجهات الكمبيوتر أكثر تنافسية بشكل كبير على مدار العام الماضي. أطلقت Anthropic Claude Computer Use في أكتوبر 2024، وأطلقت OpenAI Operator في أوائل 2025، وقامت Microsoft بدمج سيناريوهات الوكيل في Copilot Studio لـ Azure. الآن ينضم Google إليهم بتطبيقه بناءً على أحد أسرع النماذج. تتكشف المنافسة على عدة محاور: دقة التعرف على الواجهة وسرعة تنفيذ سلاسل الإجراءات والأمان وقدرات التدقيق للمؤسسات.

تتمتع Google بميزة هيكلية لا يملكها المنافسون: يعمل Gemini في نظام بيئي حيث تم نشر Gmail و Drive و Calendar بالفعل. يحصل الوكيل الذي يرى الشاشة في نفس الوقت ولديه وصول أصلي إلى بيانات المؤسسة عبر API على مستوى سياق مختلف بشكل أساسي—بدون تحميل موجه إضافي.

"نحن نبني الذكاء الاصطناعي الذي لا يجيب على الأسئلة فقط، بل ينفذ العمل"، —هذا هو الموقف العام لـ

Google بشأن استراتيجية Gemini كمنصة وكيل.

ما يعني هذا

ينتقل التحكم في الكمبيوتر من قدرات تجريبية إلى ميزة منتج قياسية لدى جميع موفري الذكاء الاصطناعي الرئيسيين. بالنسبة للعمل، يعني هذا أتمتة مهام تشغيلية حقيقية الآن—بدون إعادة كتابة الأنظمة القديمة، بدون تطوير تكاملات API لكل سيناريو، وبدون إشراك المطورين للأتمتة الأساسية. السؤال لم يعد "هل سيعمل؟"، بل "من سينفذه بشكل أسرع؟".

ZK
Hamidun News
أخبار الذكاء الاصطناعي بدون ضوضاء. اختيار تحريري يومي من أكثر من 400 مصدر. منتج من جمال حميدون، رئيس الذكاء الاصطناعي في Alpina Digital.

هل تحتاج إلى ذكاء اصطناعي يعمل داخل شركتك — وليس فقط في موجز الأخبار؟

أبني ذكاءً اصطناعياً جاهزاً للإنتاج للشركات — أنظمة CRM مخصّصة، أدوات داخلية، وكلاء مستقلون، أتمتة سير العمل. ملك لك، مصمّم وفق عمليتك، دون رسوم لكل مستخدم. من إعداد جمال خميدون، مدير المنتجات في AlpinaGPT (منصة ذكاء اصطناعي، أكثر من 6000 مستخدم).

ما رأيك؟
جارٍ تحميل التعليقات…