5 نماذج مفتوحة صغيرة مع tool calling: وكلاء لا يحتاجون إلى السحابة
اكتسبت نماذج اللغة الصغيرة القدرة على استدعاء الوظائف واستخدام الأدوات، وهذا هو المفتاح لوكلاء AI اللامركزيين. وبدلاً من الخدمات السحابية، بات بالإمكان الآن تشغ

واجهت نماذج اللغة الصغيرة صعوبات طويلة في المنافسة مع خدمات السحابة في إحدى الإمكانيات الرئيسية—إدارة الأدوات من خلال استدعاء الأدوات. الآن يتغير هذا. ظهر جيل جديد من النماذج المدمجة والمفتوحة المصدر التي لا تدعم فقط استدعاءات الوظائف المنظمة، بل تبقى خفيفة بما يكفي للنشر المحلي.
ما هو استدعاء الأدوات ولماذا يعمل
استدعاء الأدوات هو قدرة النموذج على استدعاء الدوال الخارجية أو البرامج النصية أو واجهات برمجة التطبيقات مباشرة، بدلاً من مجرد كتابة الكود كرد. يرى النموذج قائمة بالوظائف المتاحة مع الأوصاف وبارامتراتها وأنواع البيانات، ويقرر بشكل مستقل أي وظيفة يستدعيها وبأي حجج.
هذا حرج للوكلاء الذين يعملون بالذكاء الاصطناعي: يمكنهم إدارة قواعد البيانات وتنزيل الملفات وإرسال رسائل البريد الإلكتروني وجدولة الاجتماعات—كل ذلك دون تدخل بشري مباشر.
المخرجات المنظمة (الإجابات بصيغة JSON) هي ضمان بأن النموذج سيعيد النتائج بالصيغة الصحيحة والمتوقعة التي يمكن للبرنامج أن يحللها ويستخدمها.
حتى وقت قريب، كان بإمكان النماذج الكبيرة فقط (GPT-4، Claude 3) أن تفعل ذلك بشكل موثوق. الآن تعلمت النماذج الصغيرة أيضاً إخراج JSON منظم بدون أخطاء.
لماذا النماذج الصغيرة تنافسية الآن
النماذج الصغيرة (معاملات 7B-13B) لها عدة مزايا على النماذج الكبيرة. إنها أرخص في التطوير والاستدلال، أكثر خصوصية بشكل افتراضي (لا ترسل البيانات إلى السحابة)، وأسرع في الاستجابة.
لا تتطلب خدمات السحابة والأجهزة الحاسوبية الثقيلة للشركات—وحدة معالجة الرسومات متوسطة المدى أو حتى وحدة معالجة مركزية لائقة كافية. أضف دعم استدعاء الأدوات إلى مثل هذا النموذج الصغير وستحصل على وكيل ذكاء اصطناعي ذي وظائف كاملة يمكن تشغيله على خادمك الخاص أو جهاز الكمبيوتر المحمول أو حتى هاتف ذكي بدون إنترنت.
يفتح هذا الطريق أمام وكلاء خاصين بالشركات مع ضمانات سرية البيانات. يمكن لشركة تشغيل وكيل داخل شبكتها الآمنة الخاصة دون إرسال طلب واحد إلى السحابة.
بالإضافة إلى ذلك، هناك مرونة في الترخيص: جميع هذه النماذج مفتوحة المصدر ويمكن استخدامها لأغراض تجارية دون طلب إذن.
5 نماذج جاهزة للاستخدام
فيما يلي خمسة نماذج صغيرة تدعم بالفعل استدعاء الأدوات الكامل اليوم:
- Llama 3.1 (Meta) — نسخة أساسية 8B مع توثيق جيد وأمثلة على استدعاء الأدوات؛ الأكثر اختباراً واستقراراً في القائمة
- Mistral 7B — مدمجة وسريعة جداً، توازن جيد بين الجودة والحجم؛ شهيرة في بيئات المؤسسات
- PhiLM 3 (Microsoft) — محسّنة خصيصاً للمخرجات المنظمة والمهام الهندسية؛ الحد الأدنى من متطلبات الذاكرة
- OpenChat 3.5 — مركزة على الوظائف وإدارة الأدوات؛ معايير قوية في اختبارات استدعاء الأدوات
- Neural Hermes 2.5 (finetuned Mistral) — تتعامل بشكل أفضل مع السلاسل المعقدة متعددة الخطوات واسترجاع الأخطاء
يمكن تنزيل جميع الخمسة من Hugging Face في دقائق وتشغيلها محلياً بدون إنترنت. وقت الاستدلال (الاستجابة للاستعلام) يتراوح من 50 إلى 200 ميلي ثانية على وحدات معالجة الرسومات الحديثة أو وحدات المعالجة المركزية السريعة.
ما يعنيه هذا للصناعة
انتهت حقبة احتكار السحابة على وكلاء الذكاء الاصطناعي. الآن حتى الشركات الناشئة الصغيرة والشركات يمكنها بناء وكلاء ذكاء اصطناعي خاصة وكاملة الوظائف تعمل بنفس السرعة وليست أقل ذكاءً من البدائل السحابية مثل OpenAI API أو Claude عبر السحابة.
هذا يعني أن كل البنية التحتية للذكاء الاصطناعي تنتقل تدريجياً من السحابة إلى on-premise. في الأشهر القادمة، نتوقع زيادة في الأدوات والأطر العمل لنشر الوكلاء محلياً (مثل LM Studio، Ollama، لكن مع دعم مناسب لاستدعاء الأدوات).
بالنسبة للمطورين، يفتح هذا سوقاً جديداً تماماً: وكلاء ذكاء اصطناعي خاصين للشركات الكبيرة والوكالات الحكومية والرعاية الصحية والتكنولوجيا المالية. في أي مكان يكون استخدام السحابة محظوراً لأسباب سياسية أو قانونية، النماذج المحلية هي الطريقة الوحيدة.