حزمة مفتوحة المصدر من 6 نماذج و9 وكلاء أظهرت كيف يمكن بناء فريق AI على خادم واحد
خادم GPU واحد، وستة نماذج مفتوحة المصدر، وتسعة وكلاء — هكذا يبدو فريق AI مستقل يصمم ويكتب ويختبر وينشر وكلاء جدداً بنفسه. وبدلاً من نموذج شامل واحد، جرى…
معالج بواسطة الذكاء الاصطناعي من Habr AI؛ بتحرير Hamidun News
فريق مستقل يضم تسعة وكلاء ذكاء اصطناعي يمكنه أن يصمم وينشئ ويختبر ويكمل نشر وكلاء جدد دون تدخل بشري. وهذا لا يتطلب مجموعة من واجهات برمجية مغلقة: يتم بناء المخطط على ستة نماذج مفتوحة المصدر وفي النسخة الأساسية يناسب خادم واحد بمعالج رسوميات واحد.
كيف يتم تنظيم الفريق
بدلاً من نموذج "عام"، قام المؤلف بتجميع خط أنابيب يضم تسعة أدوار. يتولى بعض الوكلاء صياغة المهام والعمارة، بينما يتولى آخرون كتابة الأكواد والتحقق من الجودة والاختبار والنشر. النتيجة ليست مساعداً واحداً كبيراً، بل منظمة هندسية صغيرة حيث يقوم كل مشارك بعمل ضيق. يقلل هذا النهج من الفوضى: لا يحتاج الوكيل إلى التخطيط للنظام وكتابة الوحدات النمطية وتشغيل الاختبارات وتقييم أخطائه الخاصة في نفس الوقت.
الفكرة الأساسية هي أن الاستقلالية تتحقق ليس بالسحر، بل بتقسيم العملية إلى مراحل. إذا كان الوكيل يفهم فقط جزءه الخاص ويتلقى مهمة منظمة بالفعل كمدخل، تصبح متطلبات النموذج أوضح. يجب أن يكون منسق العمليات قادراً على التفكير والحفاظ على السياق، والمنشئ يجب أن ينتج أكواداً بثبات، والناقد يجب أن يرى المشاكل في استخدام الأدوات وسيناريوهات التنفيذ. لهذا السبب تأتي الفائدة ليس من نموذج خارق واحد، بل من التجميع الدقيق للأدوار في خط أنابيب فعال.
الأدوار والمعايير
يرفض المؤلف بشكل مباشر فكرة "النموذج الأفضل على الإطلاق". بدلاً من ذلك، يتم اختيار الأدوار بناءً على ما تؤكده المعايير. بالنسبة لمنسق العمليات، يكون التفكير مهماً، لذا المعيار هو GPQA بنسبة 88.4٪. بالنسبة للمنشئ، يكون توليد الأكواد حرجاً، وهنا يتم استخدام HumanEval بنسبة 92.7٪. بالنسبة للناقد، يكون فهم استخدام الأدوات وسلوك الوكلاء في المهام أكثر أهمية، لذا يتم استخدام tau-bench بنسبة 87.4٪.
يتم استخدام ستة نماذج مختلفة مفتوحة المصدر بدلاً من نموذج GPT-class واحد لجميع الحالات بسبب هذا التخصص بالذات.
- منسق العمليات — تفكير قوي وتحديد الأولويات وتحليل المهام
- المنشئ — توليد الأكواد والتغييرات الهندسية السريعة
- الناقد — التحقق من استخدام الأدوات وجودة الحلول والنقاط الضعيفة في خط الأنابيب
- الأدوار الأخرى — الاختبارات والنشر والمراحل المساعدة حيث يمكن إعادة استخدام الحالات المشتركة
في نفس الوقت، تسعة وكلاء لا يعني تسعة نماذج كاملة في الذاكرة في نفس الوقت. إحدى الحيل العملية هي مشاركة الحالات: عدة أدوار تتقاسم نفس النموذج إذا كانت أحمالها وملفات مهامها متشابهة. نتيجة لذلك، يمكن لنظام يضم تسعة وكلاء أن يعمل على ثلاث أو أربع حالات نموذج فقط. يقلل هذا بشكل كبير من استهلاك الذاكرة، ويبسط الصيانة، ويجعل العمارة أقرب إلى الإنتاج الحقيقي بدلاً من عرض توضيحي برصيد غير محدود.
الأجهزة والتشغيل
من الجدير بالاهتمام بشكل منفصل جزء البنية التحتية. يصف المؤلف ثلاث تكوينات نشر: من RTX 4090 واحد بذاكرة 24 غيغابايت إلى عنقود A100 بإجمالي 211 غيغابايت. بين هذه النقاط القصوى، يمكنك اختيار توازن بين السرعة والجودة والتوازي. لتقليل التكاليف، يتم استخدام الكم، والبنية التحتية للاستدلال المصممة بشكل جيد، ولوحة معلومات تفاعلية تساعد على تتبع الأدوار والحمل وتقدم المهام.
أي أنها ليست مجرد مسألة اختيار النماذج، بل أيضاً بيئة تشغيلية مناسبة لها. الخلاصة العملية بسيطة: لا تعود الاستقلالية مفتوحة المصدر لعبة للمختبر. إذا كانت هذه الأنظمة مرتبطة سابقاً بواجهات برمجية مكلفة أو عناقيد ثقيلة، فهنا يتم عرض طريق أكثر واقعية للبدء. يمكن لفريق صغير أن يبدأ بخادم واحد والتحقق من قابلية خط الأنابيب وثم توسيعه مع نمو المهام. تكلفة القضية تبدو الآن مثل خيار هندسي وليس عائقاً يستبعد معظم الفريقين.
ماذا يعني هذا
ينتقل السوق من فكرة نموذج "سحري" واحد إلى أنظمة موجهة حسب الأدوار، حيث تكون التركيبة الصحيحة أكثر أهمية من اسم واجهة برمجية مشهور. بالنسبة للأعمال التجارية، هذه إشارة: يمكن تجميع فرق الذكاء الاصطناعي المستقلة من مكونات مفتوحة المصدر الآن، إذا كنت تتعامل معها كبنية تحتية وعملية، وليس كنافذة دردشة واحدة.
هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟
AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.