وحدات NPU في الحواسيب المحمولة: متطلبات جديدة لتقنية المعلومات المؤسسية
أصبحت وحدات NPU (المعالجات العصبية) جزءًا من SoC في الحواسيب المحمولة — AMD Ryzen AI 300 وIntel Core Ultra. وتشترط Microsoft وجودها في أجهزة Copilot+ PC. وتواجه
معالج بواسطة الذكاء الاصطناعي من Habr AI؛ بتحرير Hamidun News
تفقد السحابة ببطء احتكارها لحوسبة الذكاء الاصطناعي. كتبت Microsoft معالج عصبي في المتطلبات الإلزامية لـ Copilot+ PC، وتقوم AMD و Intel بدمج NPU مباشرة في SoC — وتواجه تكنولوجيا المعلومات في الشركات خيارًا لم يكن موجودًا من قبل.
ثلاثة معالجات في شريحة واحدة
تحتوي SoCs الحديثة مثل AMD Ryzen AI 300 أو Intel Core Ultra على ثلاثة محركات حوسبة: CPU كلاسيكية و GPU و NPU. من حيث النظرية، يبدو الأمر بسيطًا، لكن معالج عصبي هو حيوان مختلف تمامًا. تم تحسين NPU لعمليات المصفوفة: تعمل الشبكات العصبية بشكل أسرع هنا منها على GPU عام. لكن فقط إذا كان النموذج يناسب الذاكرة المحلية.
وضعت AMD و Intel فقط 16 GB من VRAM (أو أقل) في NPU، بينما يشارك GPU الذاكرة الرئيسية للكمبيوتر المحمول. هذا التسوية واضحة في المعايير. قام NPU في AMD Ryzen AI 300 بإنشاء صورة في 70 ثانية، بينما تعامل GPU المدمج من نفس الشريحة معها في 30. خسر المعالج المتخصص أمام المعالج العام بنسبة النصف — في المهمة التي تم تصميمه من أجلها. الاختناق: الذاكرة. عندما يكون النموذج أكبر مما يمكن لـ NPU أن يحتفظ به، يصبح معالج الأعصاب اختناقًا بدلاً من معجل.
الهندسة المعمارية الهجينة لتكنولوجيا المعلومات في الشركات
السيناريو الرئيسي الذي تروجه Microsoft والشركاء:
- مهام ذكاء اصطناعي خفيفة (تصنيف، بحث، توليد نصوص صغيرة) — على NPU محليًا
- نماذج معقدة (LLMs كبيرة، معالجة الفيديو) — في السحابة
- البيانات تبقى جزئيًا على الجهاز، وتتم مزامنتها جزئيًا
- تم بناء منطق الإزاحة في التطبيق
بالنسبة لتكنولوجيا المعلومات في الشركات، هذا يعني تحديات جديدة. في السابق، كان يمكنك ببساطة نشر خدمة سحابية والنسيان. الآن تحتاج إلى:
إدارة النماذج على الأجهزة. يتلقى كل كمبيوتر محمول مجموعة من نماذج ONNX أو TensorFlow. يمكن أن تختلف الإصدارات. يتم سحب التحديثات عبر الإنترنت. بالنسبة لـ 50 ألف كمبيوتر محمول في الشركة، يصبح هذا تحديًا لوجستيًا.
التحكم في الذاكرة. إذا كان النموذج لا يناسب 16 GB من NPU — يتعطل التطبيق. في السابق، كان مهندس السحابة يحل هذا مرة واحدة. الآن تحتاج إلى خوارزمية لتحديد النموذج على العميل بناءً على التكوين.
مراقبة البطارية. يستهلك NPU طاقة أقل من GPU، لكن هذا مكسب أصغر مما يبدو للوهلة الأولى.
ما الذي يعمل بالفعل الآن
تناسب LLMs الصغيرة (مثل Phi-3.5 بـ 3.8B معاملات) بالكامل على كمبيوتر محمول. يعمل الاستدلال على NPU في الوقت المقبول. لكن هذا يعمل فقط للقراءة والتصنيف. لا تزال توليد النصوص على Llama-2-7B الكاملة بطيئة.
Copilot for Microsoft 365 — المستفيد الرئيسي. البحث في المستندات، ملخصات البريد الإلكتروني، جدولة الاجتماعات — كل هذا يعمل محليًا. تعد Microsoft بأن هذا سيحسن الخصوصية (لا تذهب البيانات إلى السحابة) والسرعة (بدون تأخير الشبكة).
ما يعنيه هذا
فاز صانعو الأجهزة المحمولة في الأسواق المتخصصة. حصلت تكنولوجيا المعلومات في الشركات على أداة تحتاج إلى تعلم كيفية استخدامها. الأجرأون يستعدون بالفعل لمنصات توصيل النموذج. ينتظر الآخرون حتى يتم تبسيط الأمر. لا أحد يغادر السحابة — بالتعريف، يحتوي المستقبل الهجين على كلا الجزأين.
هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟
AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.