كيفية تشغيل DeepSeek على خادمك الخاص: الذاكرة والإعدادات والخصوصية التامة

هل تعبت من الوثوق بطلباتك إلى واجهات برمجية عامة؟ حان الوقت لنشر DeepSeek على خادمك السحابي الخاص. يتطلب نموذج 7B بصيغة Q4 فقط 6-8 GB من VRAM، ويعمل عبر Ollama في دقائق، ويوفر واجهة برمجية متوافقة مع OpenAI. قم بتوصيل أي عميل — Open WebUI و Cursor و n8n. بدون تسرب بيانات أو حجب إقليمي أو رقابة مفاجئة — فقط بنيتك التحتية والتحكم الكامل.

Khamidun Zhemal

رصد الذكاء الاصطناعي · Habr AI

30 أبريل 2026· 2 د

معالج بواسطة الذكاء الاصطناعي من Habr AI؛ بتحرير Hamidun News

كيفية تشغيل DeepSeek على خادمك الخاص: الذاكرة والإعدادات والخصوصية التامة — المصدر: Habr AI. كولاج: Hamidun News.

◐ استمع للمقال

الخدمات اللغوية الكبيرة العامة مريحة، لكنها تعاني من عيب منهجي — لا تعرف ما يحدث لبياناتك. يمكن نشر DeepSeek على خادمك السحابي الخاص: تبقى المحادثات معك فقط، لا توجد حجوبات إقليمية، وتصبح القابلية للتنبؤ بالتكاليف معياراً.

لماذا الانتقال إلى خادمك الخاص

مشكلة واجهات برمجة التطبيقات العامة تتجاوز التكلفة. حتى على الخطط المدفوعة، فأنت في الأساس ترسل الطلبات إلى بنية تحتية لجهات خارجية بدون ضمانات الخصوصية. لدى Alibaba و OpenAI والموردين الآخرين سياسات خاصة بهم لاستخدام البيانات — ولا يمكنك السيطرة على ما يحدث لبياناتك على خوادمهم. تضمن بعض الشركات بشكل صريح في شروط الخدمة الحق في استخدام المحادثات لتدريب إضافي إذا لم يتم تعطيله صراحة. أضف الرقابة الصارمة في بعض النماذج — حيث الردود على الطلبات الصحيحة تماماً غير متاحة بدون تفسير — والحجوبات الجغرافية المفاجئة، وتحصل على عملية عمل مرتبطة بواجهة برمجية عامة تصبح عرضة للقرارات الخارجية للموفر.

يحل Self-hosted جميع هذه المشاكل:

الخصوصية: الطلبات لا تترك أبداً بنيتك التحتية
بلا رقابة: يعمل النموذج بدون قيود خارجية على المحتوى
بلا حجوبات إقليمية: الخدمة متاحة من أي دولة
تكاليف قابلة للتنبؤ: ادفع فقط للمثيل السحابي، بدون مفاجآت في الأسعار
التحكم الكامل: الضبط الدقيق، إعادة التدريب، التكامل مع منتجاتك الخاصة

متطلبات الذاكرة والأجهزة

المعامل الرئيسي عند اختيار التكوين هو حجم ذاكرة وحدة معالجة الرسومات. يعتمد على حجم النموذج ومستوى التكمية. DeepSeek-R1 في المتغير 7B بتنسيق Q4 يتطلب حوالي 6-8 جيجابايت من ذاكرة وحدة معالجة الرسومات — حتى وحدة معالجة رسومات سحابية اقتصادية يمكنها التعامل معها.

يشغل الإصدار 14B 10-12 جيجابايت، و 32B — حوالي 20 جيجابايت. DeepSeek-V3 الكاملة بـ 685 مليار معامل في التكمية 8-بت ستتطلب مئات جيجابايت — هذا بالفعل إقليم عناقيد وحدات معالجة الرسومات. بالنسبة لمعظم سيناريوهات العمل، المتغيرات 7B أو 14B هي الأمثل: توازن معقول بين جودة الإجابة وتكلفة البنية التحتية.

التشغيل على وحدة المعالجة المركزية ممكن، لكنه أبطأ بكثير — الحد الأدنى الموصى به هو 32 جيجابايت من ذاكرة الوصول العشوائي وتخزين NVMe سريع. تقليل التكمية Q4 من متطلبات الذاكرة حوالي النصف مقارنة بـ FP16 مع فقدان الجودة الأدنى.

كيفية الإعداد والتكوين

المسار الأبسط هو Ollama. يتم تثبيته بأمر واحد على Linux و macOS و Windows؛ يتم تحميل النموذج عبر `ollama pull deepseek-r1:7b`. يقوم الخدمة تلقائياً بتشغيل واجهة برمجية REST على المنفذ 11434 بواجهة متوافقة مع OpenAI — يتصل بها Open WebUI و Cursor و n8n ومعظم العملاء الشهيرين بدون تكوين إضافي. للإنتاج مع الأحمال العالية، vLLM أنسب: يدعم المجموعة والطلبات المتوازية ووحدات معالجة رسومات متعددة في نفس الوقت. llama.cpp يوفر أقصى مرونة — يعمل على أي منصة، يدعم جميع تنسيقات التكمية GGUF، ويستهلك موارد قليلة. كلا الخيارين يوفران واجهة برمجية متوافقة مع OpenAI.

عدة معاملات حرجة منذ الإطلاق الأول:

`context_length` — اضبطه حسب مهامك؛ القيمة الافتراضية غالباً ما تكون غير كافية للمحادثات الطويلة
`num_threads` — لوضع وحدة المعالجة المركزية، اضبطه مساوياً لعدد الأنوية الفعلية وليس المنطقية
`gpu_layers` — عدد طبقات النموذج المُفرغة في وحدة معالجة الرسومات؛ يتطلب ضبطاً تجريبياً
`temperature` و `top_p` — تؤثر على حتمية الإجابات، مهمة للإنتاج

"الميزة الرئيسية لـ LLM self-hosted هي القابلية للتنبؤ. لا مفاجآت مع

قطع الوصول أو تغييرات السياسة غير المتوقعة أو الرقابة في التحديث التالي."

ما يعنيه هذا

Self-hosting LLM لم يعد حكراً على المتحمسين. نشر DeepSeek على خادم سحابي اليوم هو مهمة لعدة ساعات حتى بدون خبرة عميقة في DevOps. بالنسبة للشركات التي تعمل مع بيانات سرية، لا يعد بديلاً لواجهات برمجية التطبيقات العامة — إنها ضرورة عملية.

Hamidun News

أخبار الذكاء الاصطناعي بدون ضوضاء. اختيار تحريري يومي من أكثر من 50 مصدر. منتج من جمال حميدون، رئيس الذكاء الاصطناعي في Alpina Digital.

قناة Telegram RSS hamidun.com

هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟

AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.

🎓 Academy — 7 أيام مجاناً استشارة مجانية