Together AI Blog→ المصدر

شركة Together AI تطلق مجموعات GPU ذاتية الخدمة Instant Clusters على معالجات NVIDIA H100 و B200

أطلقت شركة Together AI منصة Instant Clusters - وهي مجموعات GPU ذاتية الخدمة لتدريب وإخراج النماذج. تدعم معالجات NVIDIA H100 و B200، وجاهزة للعمل في دقائق دون مو

معالج بواسطة الذكاء الاصطناعي من Together AI Blog؛ بتحرير Hamidun News
شركة Together AI تطلق مجموعات GPU ذاتية الخدمة Instant Clusters على معالجات NVIDIA H100 و B200
المصدر: Together AI Blog. كولاج: Hamidun News.
◐ استمع للمقال

أطلقت شركة Together AI رسمياً منصة Instant Clusters - وهي مجموعات GPU ذاتية الخدمة التي يتم نشرها في دقائق وجاهزة للإنتاج دون موافقات طويلة وتكوين يدوي.

ما هذا

Instant Clusters عبارة عن مجموعات GPU مستندة إلى معالجات NVIDIA H100 و B200، يتم نشرها عبر API كخدمات سحابية. يمكنك إنشاء مجموعة من خلال واجهة الويب أو CLI أو برمجياً، وفي دقائق قليلة تكون جاهزة لقبول أعباء العمل.

تسمح العمارة ببدء تشغيل بتكوين مضغوط - 8 وحدات GPU على عقدة واحدة - والتوسع إلى مئات وحدات GPU في تكوين شبكة موزعة دون تغيير رمز التطبيق. المجموعات مرنة في اختيار التنسيق: تدعم Kubernetes لأعباء العمل المحتوية على عناصر وSlurm للحوسبة الفائقة التقليدية. يمكنك تثبيت إصدارات NVIDIA Driver و CUDA لكل مجموعة، مما يضمن الاستنساخ بين عمليات التشغيل والتجارب. يجعل التكامل مع أدوات البنية التحتية كأداة (Terraform و SkyPilot) النشر جزءاً من خط أنابيب CI/CD.

المكدس الكامل مضمن

عادة ما تتطلب عملية بناء مجموعة GPU أياماً من العمل الهندسي: تثبيت برامج التشغيل على كل عقدة، وتكوين بنى الشبكة، وتكوين شهادات HTTPS، وتنظيم التخزين وإدارة الموارد. تحل Instant Clusters هذه المشكلة: جميع المكونات الحرجة مدمجة بالفعل في الصورة وجاهزة للتشغيل.

ما يتضمنه:

  • GPU Operator — التثبيت التلقائي وإدارة برامج تشغيل NVIDIA، والذي يتضمن وقت التشغيل لـ CUDA والحاويات
  • Ingress Controller — توجيه حركة المرور الواردة إلى المجموعة، مع دعم التوازن والفشل الاحتياطي
  • NVIDIA Network Operator — إدارة الشبكات عالية السرعة (NVIDIA Quantum InfiniBand و Spectrum-X Ethernet مع RoCE)
  • Cert Manager — الإنشاء التلقائي وتدوير شهادات TLS لنقاط نهاية HTTPS
  • التخزين — تخزين متوازي عالي الأداء يقع بالقرب من عقد الحوسبة للوصول السريع

النتيجة: المجموعة جاهزة للإنتاج من الصندوق، بدون أسابيع من التكوين بعد النشر.

محسّن للتدريب الموسّع

تم تصميم المجموعات للتدريب الموزع للنماذج. يتم استخدام NVIDIA Quantum-2 InfiniBand بين العقد مع ضمان زمن انتقال منخفض وإنتاجية عالية. داخل كل عقدة، تتصل وحدات GPU عبر NVLink و NVLink Switch، مما يوفر اتصالات فائقة السرعة. هذه العمارة حرجة للتعلم التعزيزي والتدريب المسبق للنماذج الكبيرة والجداول التدريبية متعددة المراحل.

مثال ملموس: شركة Latent Health تدرب نماذج تتفكر مثل الأطباء، محللة البيانات السريرية متعددة الأشكال. يجب أن تأخذ النماذج في الاعتبار التفضيلات المعقدة (على سبيل المثال، كيفية حل التشخيصات المتضاربة) ومتطلبات شركات التأمين المختلفة. باستخدام Instant Clusters، يمكنهم تشغيل التعلم التعزيزي على نطاق واسع على مجموعات البيانات السريرية الكاملة، والتجريب السريع، ثم تقطير النتائج في نماذج صغيرة فعالة التي غالباً ما تتفوق على نماذج الأساس الأكبر بكثير.

«باستخدام

Instant Clusters، يمكننا بدء تجربة بكامل النطاق في غضون ساعات بدلاً من أسابيع إعداد البنية التحتية».

ما معنى هذا

تشعر البنية التحتية للـ GPU لأول مرة بأنها سحابة حديثة: API-first، الخدمة الذاتية، التوسع القابل للتنبؤ به. في السابق، تم تجميع مجموعات GPU يدوياً، لفترة طويلة وبشكل معقد. الآن هذه خدمة سحابية مُدارة.

بالنسبة للشركات الناشئة، هذا يعني مسار سريع للاستدلال الأول بدون تكاليف هندسية للبنية التحتية. بالنسبة للشركات - الاستجابة السريعة للطلب: الزيادة غير المتوقعة في حركة الاستدلال أو مشروع بحثي جديد يتطلب فقط استدعاء API، وليس عمليات شراء طويلة.

ZK
Hamidun News
أخبار الذكاء الاصطناعي بدون ضوضاء. اختيار تحريري يومي من أكثر من 400 مصدر. منتج من جمال حميدون، رئيس الذكاء الاصطناعي في Alpina Digital.

هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟

AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.

ما رأيك؟
جارٍ تحميل التعليقات…