Habr AI→ المصدر

أطلقت Sova AI مساعد Android يتحكم في الهاتف بدون جهاز كمبيوتر وroot

قدمت Sova AI مساعد Android يتحكم في التطبيقات مباشرة على الهاتف الذكي بدون ADB وUSB وroot واتصال بجهاز كمبيوتر. يعمل الوكيل عبر Accessibility API، ويجمع بين شجر

أطلقت Sova AI مساعد Android يتحكم في الهاتف بدون جهاز كمبيوتر وroot
المصدر: Habr AI. كولاج: Hamidun News.
◐ استمع للمقال

تحاول Sova AI احتلال نيش لم يتعاملوا معها الممثلون الكبار بعد بشكل صحيح: إنشاء مساعد ذكي اصطناعي لا يقتصر على الإجابة على الطلبات، بل يعمل فعليًا داخل تطبيقات Android مباشرة على الهاتف الذكي. يتم تقديم المشروع باعتباره أول وكيل محمول من هذا النوع لا يتطلب ADB ولا اتصال USB ولا root ولا ربط بجهاز كمبيوتر. يقوم المستخدم بتثبيت تطبيق عادي، ويمكنه تحديده اختياريًا كمساعد النظام، ويمكنه إصدار أوامر صوتية أو نصية، وبعد ذلك يقوم الوكيل بنفسه بفتح الخدمات اللازمة والنقر على الأزرار والتمرير عبر الشاشات وتنفيذ الخطوات بالطريقة التي يفعلها الإنسان.

الرهان الرئيسي لشركة Sova AI ليس على واجهة محادثة أخرى، بل على فكرة وجود مستمر في جهاز محمول. هناك بالفعل حلول في فئة mobile-use في السوق، لكن العديد منها لا يزال يتطلب توصيل الهاتف بجهاز كمبيوتر أو تصحيح أخطاء عبر كابل أو حلول بديلة تقنية أخرى. بالنسبة للمستخدم العادي، هذا غير مريح: إذا كان جهاز الكمبيوتر متاحًا بالفعل بالقرب، فمن الأفضل تفويض المهمة إلى computer-use أو browser-use الكلاسيكي.

ينطلق مؤلفو المشروع من سيناريو مختلف: يجب أن يظل الهاتف بيئة مستقلة حيث يمكن للمساعد تنفيذ إجراءات روتينية في أي وقت—في الطريق، في الطابور، بين الاجتماعات، أو في حالة لا يتوفر فيها جهاز محمول في متناول اليد. من الناحية الفنية، يعتمد الوكيل على API إمكانية الوصول لنظام Android. يتيح له ذلك رؤية هيكل الشاشة من خلال شجرة الواجهة، والعثور على عناصر التحكم، وإعادة إنتاج إجراءات المستخدم: النقرات والتمرير والتنقل بين التطبيقات والخطوات الأساسية الأخرى.

ومع ذلك، يؤكد المطورون بشكل خاص على أن لقطات الشاشة وحدها ليست كافية لهذه المهمة. لا تقوم النماذج دائمًا بتفسير صور الواجهة بشكل مستقر، وتعالج جودة الصورة بطرق مختلفة، وقد ترتكب أخطاء في العناصر الصغيرة. لذلك، في Sova AI قاموا بإنشاء نهج هجين: يتم دمج البيانات من شجرة الشاشة مع السياق البصري لزيادة الدقة وعدم زيادة استهلاك الرموز لكل عملية في نفس الوقت.

هذا الجانب الاقتصادي لا يقل أهمية عن سحر الأتمتة نفسه. إذا كان من المفترض أن يكون الوكيل المحمول قادرًا على تنفيذ عدة خطوات داخل التطبيقات، فإن تكلفة كل سيناريو تصبح حرجة بسرعة. يصرح مبتكرو Sova AI بشكل مباشر بأنهم حاولوا تجنب الحالة التي ينفق فيها المستخدم الكثير من الموارد على إجراء تافه مثل طلب الطعام أو إكمال مهمة يومية قصيرة.

ومن هنا التركيز على الجمع بين البيانات الهيكلية والصور بدلاً من النهج البحت المرئي. بالإضافة إلى ذلك، يمكن تعيين الوكيل كمساعد افتراضي لتشغيله بالصوت وترجمة الأمر فورًا إلى إجراء بدلاً من إجابة أخرى بأسلوب "لا يمكنني التفاعل مع التطبيقات." هناك اهتمام خاص هنا بحقيقة أن Sova AI تقدم تعريفًا أكثر صرامة لكلمة "مساعد".

على مدار السنتين الماضيتين، امتلأ السوق بالخدمات التي تعمل بشكل جيد في التلخيص والبحث والاستشارة ودعم الحوار، لكنها تتوقف عند حدود الإجراء الحقيقي. تحاول Sova AI تحويل هذا الحد وتحويل الهاتف الذكي إلى منصة لواجهة وكيل، حيث لا توضح الذكاء الاصطناعي فقط ما يجب القيام به بل تنفذ بنفسها السلسلة اللازمة من الخطوات. حاليًا، المشروع متاح على Android، مع نسخة iOS قيد التطوير، وهذا منطقي: يوفر Android اليوم مساحة أكثر لمثل هذا التكامل.

الخلاصة بسيطة: تُظهر Sova AI إلى أين يمكن أن تتحرك الموجة التالية من منتجات الذكاء الاصطناعي للمستهلكين—من مساعدي المحادثة إلى وكلاء التنفيذ. إذا أثبتت مثل هذه النهج أنها موثوقة وسريعة وبأسعار معقولة بشكل كافٍ، فسيكون لدى mobile-use فرصة لتصبح قطاعًا منفصلاً في السوق الشامل بدلاً من مظاهرة للمطورين. لكن جنبًا إلى جنب مع الراحة، ستزداد متطلبات الدقة والخصوصية والتحكم في الأذونات حتمًا.

بالنسبة للمستخدم، هذا لم يعد مجرد دردشة، بل برنامج يحصل على إمكانية الوصول إلى واجهة الهاتف ويعمل باسمه.

ZK
Hamidun News
أخبار الذكاء الاصطناعي بدون ضوضاء. اختيار تحريري يومي من أكثر من 400 مصدر. منتج من جمال حميدون، رئيس الذكاء الاصطناعي في Alpina Digital.

Хотите не читать про ИИ, а внедрить его?

«AI News» — это полезные новости из мира ИИ. Системно научиться работать с нейросетями и применять их в работе — в Hamidun Academy.

ما رأيك؟
جارٍ تحميل التعليقات…