AWS Machine Learning Blog→ المصدر

AWS أطلقت حجز GPU بالساعات — لاختبارات ML والاستعداد لعمليات الإطلاق

أطلقت AWS خدمة EC2 Capacity Blocks for ML، التي تتيح حجز GPU بالساعات بدلًا من العقود طويلة الأجل. وهي مناسبة لاختبارات الحمل، والتحقق من صحة النماذج، وتجهيز ال

AWS أطلقت حجز GPU بالساعات — لاختبارات ML والاستعداد لعمليات الإطلاق
المصدر: AWS Machine Learning Blog. كولاج: Hamidun News.
◐ استمع للمقال

قدمت AWS حجوزات EC2 Capacity Blocks for ML وخطط التدريب المدمجة مع SageMaker — حل جديد لحجز سعة GPU للفترات القصيرة. هذا يعالج المشكلة الرئيسية لمهندسي ML: النقص الحاد في وحدات GPU المتاحة والحاجة إلى الدفع مقابل عقود طويلة حتى عندما تكون قوة الحوسبة مطلوبة فقط لبضع ساعات. الآن يمكنك حجز عدد وحدات GPU الذي تحتاجه بالضبط وفي الوقت الذي تحتاجه بالضبط.

متى يكون وقت GPU القصير ضروريًا

في الواقع العملي، هذه السيناريوهات أكثر شيوعًا مما يبدو. اختبار الحمل قبل إطلاق ميزة جديدة يتطلب البنية التحتية الكاملة، لكن فقط ليوم أو يومين — بعد الاختبارات، لا توجد نقطة في إنفاق الأموال. التحقق من صحة النموذج — التحقق من موجه جديد أو نموذج معايرة دقيقة مقابل البيانات الحقيقية — عادة ما يستغرق 4-8 ساعات. ورش العمل الجماعية حيث يتعلم المهندسون العمل مع الأطر (PyTorch و TensorFlow) تتطلب GPU لمدة الجلسة وليس بشكل دائم. قبل إطلاق كبير، تحتاج إلى تحضير البنية التحتية للاستدلال — تشغيل الخوادم وتدفئة ذاكرة التخزين المؤقتة وتشغيل اختبارات الدخان. بالإضافة إلى ذلك، ارتفاعات حركة المرور المؤقتة خلال ساعات الذروة، عندما تكون قوة الحوسبة الإضافية مطلوبة، لكن الاهتمام ينخفض بعد ذلك.

  • اختبار الحمل قبل إطلاق الميزات
  • التحقق من صحة النموذج بعد المعايرة الدقيقة
  • تدريب الفريق وورش العمل
  • تحضير سعة الاستدلال قبل الإطلاق
  • التعامل مع ارتفاعات حركة المرور المؤقتة

كيف يعمل Capacity Blocks

المنطق بسيط: بدلاً من Reserved Instance (عقد شهري أو سنوي) أو On-Demand (مكلف للاستخدام المستمر)، تحجز كتلة GPU لفترة زمنية محددة — من ساعات إلى عدة أيام. تضمن AWS أن السعة سيتم حجزها وتكون متاحة خلال فترتك المختارة. هذا يعطي المهندسين إمكانية التنبؤ: تعرف أن وحدة GPU ستكون جاهزة عند جدولتها. الخدمة متكاملة مع خطط تدريب SageMaker — تشغل وظيفة تدريب ولا تقلق من نفاد وحدة GPU في منتصف تدريب النموذج. EC2 Capacity Blocks يعمل مع أنواع GPU المختلفة: NVIDIA H100 (لـ LLM)، A100 (الخيار الشامل)، L4 (مضغوط، للاستدلال). تختار الإعدادات حسب نوع عبء العمل. يتم إدارة كل شيء من خلال واجهة AWS المألوفة، مع التكامل مع SageMaker و CloudFormation والأدوات الأخرى.

الأسعار والمرونة

في السابق، كان الخيار مؤسفًا. إما Reserved Instance لمدة سنة — رخيصة، لكنك تفقد المرونة. أو On-Demand بالساعة — مرن، لكنك تدفع 3-4 مرات أكثر. يحتل Capacity Blocks منطقة وسطية بين الطرفين: أرخص من On-Demand، لكن بدون عقد طويل الأجل. والأهم من ذلك، لا تدفع مقابل الوقت غير المستخدم. بالنسبة للأعمال التجارية، هذا يعني تخطيطًا ميزانيًا أكثر دقة للبنية التحتية وتجنب الدفع الزائد. لن يطلب المهندسون وحدة GPU "فقط في الحالة" وبالتالي لن يضخموا النفقات. يمكن لفرق DevOps توسيع البنية التحتية بشكل مرن قبل اللحظات الحرجة — الإطلاقات والمؤتمرات والحملات التسويقية — معرفة السعر الدقيق لكل ساعة.

ماذا يعني هذا

تتكيف خدمات السحابة بشكل متزايد مع الاحتياجات الفعلية لعمل ML. عهد الطلب المسبق للـ GPUs والدفع مقابل الوقت غير المستخدم يتلاشى في الماضي. بدلاً من ذلك، تدفع فقط مقابل ما تستخدمه، في اللحظة التي تستخدمها — هذا أكثر اقتصادية وأكثر منطقية ويقلل الهدر في مشاريع البنية التحتية.

ZK
Hamidun News
أخبار الذكاء الاصطناعي بدون ضوضاء. اختيار تحريري يومي من أكثر من 400 مصدر. منتج من جمال حميدون، رئيس الذكاء الاصطناعي في Alpina Digital.
ما رأيك؟
جارٍ تحميل التعليقات…