Phi-4-Mini من Microsoft: تنفيذ التكميم وRAG وLoRA في دفتر Jupyter واحد
يضع Microsoft Phi-4-mini كامل مكدس مهام LLM الحديثة في دفتر واحد. ويأخذ الدليل العملي القارئ عبر المسار الكامل: تكميم 4 بت للتشغيل على GPU منخفض التكلفة،…
معالج بواسطة الذكاء الاصطناعي من MarkTechPost؛ بتحرير Hamidun News
أطلقت مايكروسوفت Phi-4-mini كجزء من خط نماذج اللغة المدمجة لديها — وتوضح البرامج التعليمية الجديدة ما هو قادر عليه في ظروف العمل الحقيقية. في دفتر Jupyter واحد، نفذ الباحثون مجموعة كاملة من سيناريوهات النماذج اللغوية الكبيرة الحديثة: من تكميم 4 بت إلى الضبط الدقيق للأوزان من خلال LoRA. يعتبر Phi-4-mini-instruct نموذجًا مدمجًا لكنه قويًا من مايكروسوفت، تم تطويره مع التركيز على الاستدلال واتباع التعليمات.
على عكس الأنظمة الضخمة من فئة GPT، فإنه يناسب ذاكرة وصول عشوائي محدودة ولا يزال يدعم خطوط أنابيب كاملة كانت تتطلب قبل عام واحد فقط نماذج أكبر بعشرات المرات. حوالي 3.8 مليارات معامل — مدمج وفقًا لمعايير عام 2025، عندما أصبحت النماذج الرائدة مفتوحة المصدر قد تجاوزت منذ وقت طويل الـ 70 مليار.
يبدأ البرنامج التعليمي بإعداد البيئة وتحميل النموذج في وضع تكميم 4 بت من خلال مكتبة BitsAndBytes. يقلل التكميم الأوزان دون فقدان كبير في الجودة، مما يقلل متطلبات ذاكرة الوصول العشوائي إلى مستوى حيث يعمل النموذج حتى على وحدات معالجة الرسومات المجانية في Google Colab. هذا أساسي بشكل أساسي للمطورين الذين لا يملكون إمكانية الوصول إلى مجموعات الشركات.
بعد ذلك، ينتقل البرنامج التعليمي إلى إنشاء البث: وضع بث حيث يظهر النص عند حسابه، وليس كتكتل واحد في النهاية. هذا حرج بالنسبة للتطبيقات الدردشة التفاعلية وخدمات API ذات الواجهات الحية. ثم يأتي قسم الاستدلال: يتلقى Phi-4-mini مهام تتطلب إخراجًا خطوة بخطوة — استدلال سلسلة الفكر (chain-of-thought) — ويتعامل معها بشكل ملحوظ أفضل مما يمكن توقعه من نموذج بحجمه.
تغطي الكتلة التالية استخدام الأدوات (tool use). تم تدريب النموذج على التعرف على وقت احتياج الطلب إلى استدعاء واجهة برمجية خارجية أو آلة حاسبة أو قاعدة بيانات، وصياغة استدعاء منظم بالصيغة المناسبة. هذه واحدة من المهارات الأساسية لبناء وكلاء الذكاء الاصطناعي المستقلين القادرين على التصرف في العالم الخارجي، وليس فقط توليد النصوص.
يوضح كتلة RAG كيفية توصيل متجر متجه وجعل النموذج يجيب على أسئلة حول المستندات التي لا توجد في بيانات تدريبه. سيناريو نموذجي: التوثيق الداخلي للشركة وقواعد المعرفة والتقارير التحليلية الجديدة. يثري RAG السياق دون إعادة تدريب مكلفة للنموذج بأكمله.
يركز القسم الأخير على ضبط LoRA الدقيق — طريقة الضبط الدقيق حيث يتم تحديث جزء صغير فقط من الأوزان (محولات منخفضة الرتبة) وليس جميع المعاملات في المجموع. هذا يجعل التخصيص الخاص بالمهمة في متناول حتى وحدة معالجة رسومات واحدة للمستهلك. يوضح البرنامج التعليمي دورة كاملة: تحضير مجموعة البيانات وتدريب المحول وحفظ النتائج وتطبيقها.
مثل هذا البرنامج التعليمي ليس مجرد عرض توضيحي لقدرات نموذج واحد. إنها حجة مفادها أن الحدود بين النماذج الكبيرة والصغيرة تتلاشى بسرعة. توضح Phi-4-mini: معمارية مدمجة مع الضبط المناسب تغطي معظم سيناريوهات الإنتاج.
بالنسبة للفريق الذي يبني منتجات الذكاء الاصطناعي بدون إمكانية الوصول إلى موارد حسابية مكلفة، هذا دليل عملي خطوة بخطوة.
هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟
AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.