الاستدلال

الذكاء الاصطناعي على الجهاز (On-Device AI)

الذكاء الاصطناعي على الجهاز هو تنفيذ استدلال نماذج التعلم الآلي مباشرةً على أجهزة المستخدم المحلية — الهاتف الذكي أو الحاسوب المحمول أو الشريحة المدمجة — دون نقل البيانات إلى خادم سحابة بعيد، مما يمكّن زمن كمون أقل واستخدام غير متصل وخصوصية أقوى.

الذكاء الاصطناعي على الجهاز هو ممارسة تشغيل أحمال عمل استدلال الذكاء الاصطناعي بالكامل على أجهزة المستخدم النهائي بدلاً من خوادم السحابة. تتضمن المهام القابلة للتطبيق التعرف على الكلام وتصنيف الصور وتوليد اللغة الطبيعية والترجمة والكشف عن الأشياء، وكلها تُنفذ محلياً على أجهزة مثل الهواتف الذكية والحاسوبات المحمولة والأجهزة القابلة للارتداء وأجهزة استشعار الإنترنت من الأشياء المدمجة.

يتطلب الاستدلال على الجهاز نماذج تناسب ضمن قيود الذاكرة والطاقة الضيقة. المُمكّنات الأساسية هي تقنيات ضغط النماذج — الكم (تقليل دقة الأوزان من أعداد عشرية بـ 32 بت إلى أعداد صحيحة بـ 4 أو 8 بت)، والقص (إزالة الأوزان منخفضة الأهمية)، وتقطير المعرفة (تدريب نماذج أصغر لمحاكاة نماذج أكبر) — مقترنة بوحدات معالجة عصبية مخصصة (NPUs). تُوفر شرائح مثل Neural Engine من Apple على A17 Pro و M-series و Hexagon NPU من Qualcomm في Snapdragon 8 Gen 3 وما بعده و Tensor G4 من Google عشرات من TOPS (عمليات تيرا في الثانية) عند مستويات طاقة بالميلي واط، مما يجعل الاستدلال من نماذج في نطاق 1–8B معاملات عملياً على الأجهزة الاستهلاكية.

المزايا الأساسية على استدلال السحابة هي الكمون (بدون جولة ذهاب وإياب شبكة) والخصوصية (البيانات الحساسة لا تترك الجهاز أبداً) والتوفر غير المتصل (وظيفي بدون إنترنت) وتقليل تكاليف السحابة لكل استعلام للمطورين. هذه الخصائص حاسمة في مراقبة الرعاية الصحية ومعالجة الصوت في الوقت الفعلي وأي تطبيق يتعامل مع معلومات تعريف شخصية بموجب لوائح مثل GDPR أو HIPAA.

بحلول عام 2026، نماذج اللغة على الجهاز أصبحت سائدة. Apple Intelligence (iOS 18، 2024) تشغل نموذج معاملات بـ 3B تقريباً محلياً على iPhone 16 و M-series Macs لمساعدة الكتابة والتلخيص. نماذج الأوزان المفتوحة — Llama 3 8B و Mistral 7B و Google's Gemma 3 — تعمل بسرعات عملية على حاسوبات المستخدم عبر أدوات مثل llama.cpp و Ollama و Apple MLX. التحدي الهندسي السائد هو الحفاظ على جودة المخرجات ضمن حدود دقة الكم المفروضة، وهي منطقة بحثية نشطة في 2025–2026.

مثال

تطبيق نسخ طبي يعمل على جهاز iPad صادر من المستشفى يحول إملاء الطبيب إلى ملاحظات سريرية منظمة بالكامل على الجهاز، مما يستوفي متطلبات HIPAA بضمان عدم توجيه الصوت وبيانات المريض أبداً عبر بنية الحوسبة السحابية من جهات خارجية.

مصطلحات مرتبطة

← المسرد