Ollama و LiteLLM: أظهر Habr كيفية تشغيل دردشة LLM محلية على Python بدون سحابة

Q: ما هو المصدر؟

نُشر أصلاً على Habr AI. يعالج Hamidun News المواد ويكيّفها بالذكاء الاصطناعي.

Q: متى نُشر؟

30 أبريل 2026. وقت القراءة: 3 دقيقة.

ظهر دليل واضح للبدء في تطوير LLM محلي في Python. يشرح خطوة بخطوة تثبيت Ollama وتشغيل نموذج qwen2.5 وتكوين بيئة افتراضية والاستدعاء الأول عبر LiteLLM. يغطي…

هيئة تحرير Hamidun News

رصد الذكاء الاصطناعي · Habr AI

30 أبريل 2026· 3 د

معالج بواسطة الذكاء الاصطناعي من Habr AI؛ بتحرير Hamidun News

Ollama و LiteLLM: أظهر Habr كيفية تشغيل دردشة LLM محلية على Python بدون سحابة — المصدر: Habr AI. كولاج: Hamidun News.

◐ استمع للمقال

نُشِر على منصة Habr دليل تفصيلي لتطوير نماذج اللغة الكبيرة محليًا باستخدام Python. يقترح المؤلف عدم البدء بواجهات برمجية سحابية، بل بدمج Ollama و LiteLLM: ثبّت نموذجًا على جهازك الخاص، وأعد البيئة، واحصل على أول إجابة مباشرة من main.py.

لماذا محليًا

معظم المواد التعليمية حول نماذج اللغة الكبيرة توجه المبتدئ نحو السحابة منذ الخطوة الأولى: قم بالتسجيل، احصل على مفتاح API، أضف بطاقة ائتمان، راقب الحدود. بالنسبة لمطوّر يريد فحسب فهم الآليات الأساسية، هذا ضجيج غير ضروري. يقدّم الدليل الجديد مسارًا مختلفًا: أعد كل شيء محليًا أولاً لترى منطق النموذج بدون الفوترة والخدمات الخارجية والخوف من إنفاق الأموال عرضًا على الاختبارات.

هذا النهج أفضل أيضًا لأنه يجعل كامل سير تدفق الطلب شفافًا. في المقالة، يقسّمون السلسلة حلقة فحلقة: يرسل رمز Python رسالة إلى LiteLLM، الذي يمررها إلى Ollama، و Ollama يتواصل مع النموذج المحلي ويرجع الإجابة إلى البرنامج. هذا التحليل مفيد ليس فقط للمبتدئين.

يساعد على إيجاد موضع المشكلة بسرعة إذا لم يستجب النموذج، أو لم يكن الخدمة مُشغّلة، أو كان الرمز موجّهًا إلى العنوان الخاطئ.

"هذا ليس 'سحر الذكاء الاصطناعي'، بل تدفق برمجي عادي."

ما الذي يتضمنه المكوّن البرمجي

يقسّم المؤلف فورًا أدوار الأدوات، لأنه من السهل الخلط بينها. Ollama مسؤول عن تشغيل النموذج المحلي والوصول إليه عبر خادم محلي. LiteLLM مكتبة Python توفر واجهة موحّدة لاستدعاء النماذج. بفضل هذا، يمكن نقل الرمز الذي يعمل اليوم مع نموذج محلي لاحقًا إلى مزوّد سحابي بسهولة نسبيّة دون إعادة كتابة التطبيق من الصفر. بالنسبة لمقدمة أولى، هذا توازن عملي بين البساطة والاستعداد للمستقبل.

الجزء الأول من السلسلة مصمّم كمسار بدون نظرية غير ضرورية. لا يُطلب من القراء على الفور تصميم وكلاء أو ربط الذاكرة أو بناء واجهة معقدة. المهمة أبسط وأكثر فائدة: التأكد من أن النموذج المحلي يعمل، وأن Python يستطيع الوصول إليه، وأن الإجابة تعود إلى الرمز بدون بنية تحتية خارجية. لهذا السبب، يُقرأ المادة كقائمة تحقق وظيفية لأول مساء، وليس كمراجعة مجردة للتكنولوجيات.

ثبّت Ollama لنظام Windows أو macOS أو Linux؛
حمّل نموذج qwen2.5:3b وتحقق من الإجابة مباشرة في المحطة الطرفية؛
إذا كان جهازك ضعيفًا، انتقل إلى qwen2.5:1.5b؛
أنشئ بيئة افتراضية من Python وثبّت LiteLLM؛
اكتب main.py مبسطًا يرسل طلبًا إلى http://localhost:11434.

ميزة إضافية هي اختيار النموذج للبدء. يُقدّم qwen2.5:3b كخيار مضغوط وعملي بما يكفي لجهاز محمول عادي، خاصة إذا كنت بحاجة إلى دعم اللغة الروسية. إذا كانت الموارد محدودة، يوفّر المؤلف فورًا سيناريو بديل بنسخة أخف وزنًا. هذا يجعل المادة عملية وليست مجردة: المقالة لا تعد بمعجزات، بل تساعد على الوصول فعليًا إلى أول إجابة تعمل دون عبث مكثف بالإعدادات من البداية.

أول استدعاء من Python

اللحظة الأساسية في النص هي مثال مبسط من Python. يستورد دالة completion من LiteLLM، يحدّد النموذج بصيغة ollama_chat/qwen2.5:3b، يشير إلى api_base المحلي، ويمرر سؤال المستخدم إلى قائمة messages.

هذه تفصيلة مهمة: حتى طلب واحد يُصاغ بنفس هيكل الحوار المستقبلي. بشكل أساسي، لا يعرض المؤلف استدعاء لمرة واحدة فقط، بل يضع مباشرة الأساس لدردشة في سطر الأوامر مع سجل الرسائل والسياق. من المفيد أيضًا أن المقالة لا تنتهي بالمسار السعيد.

في النهاية، يُحلّلون الأخطاء النموذجية: Connection refused إذا لم يكن Ollama مُشغّلاً؛ Model not found إذا لم يطابق اسم النموذج في الرمز النموذج المثبّت؛ إجابة طويلة جدًا بسبب تحميل النموذج في الذاكرة؛ ModuleNotFoundError إذا تم تثبيت الحزمة في البيئة الخاطئة؛ مشاكل الترميز في PowerShell. بالنسبة لمطوّر مبتدئ، هذا القسم غالبًا أقيم من النظرية، لأن هذه التفاصيل الدقيقة هي التي تعطّل معظم التجارب الأولى. حدّد المؤلف بالفعل استمرار السلسلة: في الجزء الثاني، سيبنون دردشة صغيرة في سطر الأوامر من طلب واحد، ثم سيضيفون سجل الرسائل والسياق.

أي أنه ليس مقتطفًا مبعثرًا، بل دخول منظّم إلى مسار أطول — من تشغيل النموذج محليًا إلى تطبيق كامل. هذا التنسيق مفيد بشكل خاص لمن يريد ليس فقط تشغيل نموذج توضيحي، بل تحويل نموذج اللغة الكبيرة تدريجيًا إلى جزء من مشروع Python عادي.

ماذا يعني هذا

الاهتمام بالنماذج المحلية ينمو مرة أخرى، وهذه المواد تخفّض حاجز الدخول بشكل أفضل من أي عرض عام. يُظهر دمج Ollama و LiteLLM أنه يمكن بناء أول نموذج أولي وظيفي بدون السحابة ومفاتيح API، ثم عند الحاجة توسيع نطاق نفس البنية الهندسية. بالنسبة لمطوّري اللغة الروسية، هذا جسر جيد بين الفضول حول نماذج اللغة الكبيرة والرمز الفعلي. هذا بالضبط نوع التعليمات الذي يحوّل الاهتمام إلى الممارسة في أغلب الأحيان.

Hamidun News

أخبار الذكاء الاصطناعي بدون ضوضاء. اختيار تحريري يومي من أكثر من 400 مصدر. منتج من جمال حميدون، رئيس الذكاء الاصطناعي في Alpina Digital.

قناة Telegram RSS hamidun.com

هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟

AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.

🎓 Academy — 7 أيام مجاناً استشارة مجانية