Habr AI→ المصدر

Qwen2.5 على معالج مجاني: الشبكات العصبية لمن لا يريد تمويل السحابة

تبدو صناعة الذكاء الاصطناعي في الآونة الأخيرة وكأنها ناد حصري للأثرياء. تريد تشغيل نموذج لغة لائق — كن مستعدًا لتحمل مبلغ كبير مقابل بطاقة رسومات بذاكرة…

معالج بواسطة الذكاء الاصطناعي من Habr AI؛ بتحرير Hamidun News
Qwen2.5 على معالج مجاني: الشبكات العصبية لمن لا يريد تمويل السحابة
المصدر: Habr AI. كولاج: Hamidun News.
◐ استمع للمقال

تبدو صناعة الذكاء الاصطناعي في الآونة الأخيرة وكأنها ناد حصري للأثرياء. تريد تشغيل نموذج لغة لائق — كن مستعدًا لتحمل مبلغ كبير مقابل بطاقة رسومات بذاكرة فيديو ضخمة أو اربط بطاقتك بخدمات سحابية أجنبية ستستنزف ميزانيتك أسرع مما تستطيع النموذج من إنهاء كتابة الرد. ظل يتم إقناعنا لفترة طويلة بأنه بدون وحدات معالجة رسومات قوية، فإن الوصول إلى عالم الشبكات العصبية المحلية مغلق. لكن الواقع أثبت أنه أكثر إثارة للاهتمام بكثير، واليوم نشهد كيف ينهار حاجز الدخول إلى هذه التقنيات حرفيًا تحت ثقل التحسين.

أصبح نموذج Qwen2.5 من Alibaba هو البطل الرئيسي في هذه الثورة. أنجز المطورون الصينيون معجزة صغيرة بإنشاء معمارية تقدم جودة إجابات مع ثلاثة مليارات معامل متواضعة مماثلة لنظرائها الأثقل بكثير. لكن أهم شيء هنا ليس فقط جودة النص، بل كيف يعرف هذا النموذج كيفية استخدام الموارد. إصدار 3B — وهذا هو معيار "الذهب الخالص" لمن يريدون الحصول على مساعد ذكي دون تحويل غرفتهم إلى مزرعة خادم بمراوح تزأر. فهو يتناسب بشكل مثالي مع بنية المعالجات العادية، خاصة إذا كنت تستخدم الأدوات الصحيحة.

لماذا أصبح هذا ممكنًا تحديدًا الآن؟ قديمًا، كان تشغيل نموذج لغة كبير على المعالج المركزي (CPU) مثل محاولة نقل جبل رمل في عربة يدوية للحديقة. ومع ذلك، فقد حول تطوير التقدير والمكتبات المُحسّنة تلك "العربة" إلى شاحنة نشيطة بكفاءة. عندما نتحدث عن التشغيل على الطبقة المجانية للمعالج المركزي في Hugging Face Spaces، فإننا نقصد استخدام الموارد التي توفرها المنصة لعرض المشاريع. هذا كاف تمامًا لكي يجيب روبوتك الشخصي بسرعة القراءة البشرية، وأحيانًا أسرع. لا حاجة بعد الآن للانتظار في أطوال الانتظار في مراكز GPU المجانية أو المعاناة لأن Google Colab أخذت بطاقتك الرسومية في اللحظة الأكثر حرجًا.

تبدو عملية النشر بسيطة بشكل يكاد يكون ساخرًا لتكنولوجيا بهذا المستوى. يسمح لك الجمع بين Hugging Face و Gradio بتحويل بضعة أسطر من كود Python إلى واجهة ويب كاملة يمكن استخدامها حتى من الهاتف. يتولى Gradio كل العمل الشاق لإنشاء دردشة وأزرار وحقول إدخال، بينما يعمل Hugging Face كاستضافة مجانية. لا تحتاج إلى تكوين الخوادم أو إعادة توجيه المنافذ أو التعامل مع برامج تشغيل NVIDIA. هذا برنامج نقي ومقطر يعمل مع ما لديك في متناول اليد. والأفضل من ذلك — Qwen2.5 يتعامل بشكل جميل مع اللغة الروسية، دون أن يصبح مفكرًا متطرفًا بعد الجملة الثالثة.

هذا النهج مهم ليس فقط لتوفير عشرات الدولارات. فهو يغير نموذج استخدام الذكاء الاصطناعي نفسه. عندما تصبح التكنولوجيا مستقلة عن الأجهزة مكلفة، فإنها تصبح شخصية حقًا. يمكنك تجربة مختلف المحاولات وتعديل التعليمات النظامية وإنشاء مساعدين متخصصين لمهام معينة دون مراقبة عداد الرموز على واجهة برمجة تطبيقات مدفوعة. هذه حرية من الاشتراكات والقيود التي تفرضها الشركات الكبرى. نحن نعود إلى جذور ثقافة القراصنة، حيث يهم ذكاء البرنامج أكثر من عدد الترانزستورات في المسرِّع.

بالطبع، لتشغيل المعالج المركزي حدوده. لن تتمكن من خدمة آلاف المستخدمين في نفس الوقت أو تدريب نموذج على تيرابايتات من البيانات. لكن للاستخدام الشخصي والنماذج الأولية والتعلم — هذا سيناريو مثالي. إنها طريقة رائعة لفهم كيفية عمل نماذج اللغات الحديثة من الداخل دون قضاء وقت في القتال مع البنية التحتية. في النهاية، أفضل أداة هي تلك التي لديك هنا والآن، وليس تلك التي تحتاج إلى ادخار ستة أشهر من أجلها.

النقطة الأساسية: عصر الذكاء الاصطناعي النخبوي ينتهي، والآن لإنشاء مساعدك الخاص، كل ما تحتاجه هو حساب مجاني وخمسة عشر دقيقة من الوقت. هل سيكون لدينا أي سبب لشراء وحدات معالجة رسومات مكلفة إذا استمرت التحسينات بهذا الوتيرة?

ZK
Hamidun News
أخبار الذكاء الاصطناعي بدون ضوضاء. اختيار تحريري يومي من أكثر من 400 مصدر. منتج من جمال حميدون، رئيس الذكاء الاصطناعي في Alpina Digital.

هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟

AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.

ما رأيك؟
جارٍ تحميل التعليقات…