AWS Machine Learning Blog→ المصدر

AWS عرضت كيف يمكن خفض تكلفة text-to-SQL للشركات باستخدام Amazon Nova Micro وBedrock

قدمت AWS وصفة عملية لـ text-to-SQL لقواعد البيانات المؤسسية: ضبط Amazon Nova Micro على لهجة SQL الخاصة بالشركة وتشغيل النموذج عبر Bedrock مع احتساب التكلفة…

معالج بواسطة الذكاء الاصطناعي من AWS Machine Learning Blog؛ بتحرير Hamidun News
AWS عرضت كيف يمكن خفض تكلفة text-to-SQL للشركات باستخدام Amazon Nova Micro وBedrock
المصدر: AWS Machine Learning Blog. كولاج: Hamidun News.
◐ استمع للمقال

أظهرت AWS كيفية الحصول على text-to-SQL لقواعد البيانات الداخلية بدون تكاليف استضافة دائمة مرتفعة للنماذج. قامت الشركة بضبط Amazon Nova Micro للهجات SQL غير القياسية ونشرتها عبر Amazon Bedrock بتسعير الدفع حسب الطلب.

لماذا هذا مهم

بالنسبة لسيناريوهات المؤسسات، غالباً ما لا يكون النموذج القياسي كافياً: فهو يكتب SQL القياسي بشكل معقول، لكنه يبدأ في ارتكاب أخطاء عندما تملك الشركة اصطلاحاتها الخاصة وفئات نادرة وأنماط جداول خاصة وقواعد خاصة بالمجال. لهذا السبب تحتاج استعلامات النص من المستخدم إلى التكيف مع اللهجة المحددة وهيكل قاعدة البيانات، مما يعني ضبط النموذج على أمثلة خاصة بك. هذا واضح بشكل خاص في أنظمة الذكاء التجاري والدردشات التحليلية الداخلية، حيث يؤدي خطأ بناء الجملة فوراً إلى كسر سير العمل بالكامل.

المشكلة هي أن الضبط الدقيق عادة ما يصاحبه تكاليف بنية تحتية إضافية. إذا احتفظت بنموذج مخصص على خوادم مخصصة، فإن الشركة تدفع حتى عندما لا تكون هناك استعلامات. تقترح AWS منهجاً مختلفاً في تحليلها: ضبط Amazon Nova Micro عبر LoRA وتشغيله في Amazon Bedrock في نمط الاستدلال عند الطلب، حيث يتم الفواتير لكل رمز بدلاً من السعة المحتفظ بها مسبقاً.

منهجان من AWS

تصف AWS سيناريوهين لنفس المهمة. الأول هو الضبط الدقيق المدار داخل Amazon Bedrock. يناسب الفرق التي تقدر البساطة والبدء السريع والحد الأدنى من تعقيد البنية التحتية للتعلم الآلي.

يتم تحميل البيانات في S3، ويتم تشغيل وظيفة الضبط الدقيق عبر وحدة التحكم أو API، وتدير AWS التدريب والنشر اللاحق لإصدار Nova Micro المخصص. يستهدف هذا النهج فرق التطبيقات بدلاً من منصة تعلم آلي منفصلة. الطريق الثاني هو التدريب عبر Amazon SageMaker AI.

إنه أكثر تعقيداً لكنه يوفر تحكماً أكبر على وصفة التدريب: يمكنك تعديل حجم الحزمة و dropout وملاعب محسّن الأداء ونافذة السياق وإعدادات LoRA واستراتيجية تسخين معدل التعلم. في مثال AWS، استخدموا مجموعة بيانات sql-create-context بناءً على WikiSQL و Spider، وحولوا أزواج السؤال-SQL إلى صيغة bedrock-conversation-2024 للتدريب والتحقق. يأتي هذا مع تعقيد إعدادات أكبر وعمل بنية تحتية أكثر وضوحاً.

  • Bedrock — عبء تشغيلي أقل والمسار الأسرع للنموذج الأولي الفعال
  • SageMaker AI — مزيد من التحكم في المعاملات الفائقة والتكامل MLOps
  • يستخدم كلا المخطط نفس خط أنابيب تحضير البيانات ثم يتم نشره في Bedrock
  • يتم تشغيل الاستدلال النهائي على نموذج بدون خادم مع الفواتير حسب الرموز، بدون استضافة دائمة

التكلفة والكمون

توفر AWS أرقاماً محددة. للضبط الدقيق المدار في Bedrock، يتم حساب تكلفة التدريب كـ $0.001 لكل 1.

000 رمز لكل حقبة: في المثال الذي يحتوي على 2.000 عينة و خمس حقب وحوالي 800 رمز لكل سجل، بلغت التكلفة حوالي 8 دولارات. بالنسبة لخيار SageMaker، تم استخدام مثيل ml.

g5.48xlarge بتكلفة $16.288 في الساعة؛ استغرق التدريب على مجموعة بيانات تضم 20.

000 صف حوالي أربع ساعات وكلف حوالي 65.15 دولار. الأطروحة الأساسية للمقالة ليست تكلفة التدريب الفردي، بل التكلفة التشغيلية.

قدرت AWS حملاً إنتاجياً نموذجياً بـ 22.000 طلب شهرياً، أو 100 مستخدم يقدمون 10 طلبات يومياً على مدار 22 يوم عمل. بحجم متوسط للطلب يبلغ 800 رمز للإدخال و 60 رمز للإخراج، كان الاستدلال الشهري لنموذج text-to-SQL مخصص كهذا 0.

80 دولار. هذا ممكن لأن Nova Micro المخصص في Bedrock يتم فواتيره بنفس طريقة النموذج الأساسي، بدون علاوة إضافية لنشر بدون خادم. من حيث السرعة، هناك مقابلة، لكنها معتدلة.

عند بدء بارد، زاد متوسط الوقت للرمز الأول إلى 639 ملي ثانية، وهو أعلى بنسبة 34٪ من النموذج الأساسي. في التشغيل العادي، كان متوسط TTFT 380 ملي ثانية على 50 استدعاء — أسوأ بنسبة 7٪ فقط من خط الأساس. كان كمون التوليد الكامل حوالي 477 ملي ثانية، مع الحفاظ على سرعة الإخراج عند 183 رمزاً في الثانية.

تحقق AWS من الجودة ليس فقط من خلال الكمون، بل من خلال LLM-as-a-Judge، وقارنت SQL المُنتج مع الإجابات المرجعية.

ماذا يعني هذا

بالنسبة للفرق التي تريد دمج text-to-SQL في منتجات التحليل أو أدوات الذكاء التجاري الداخلية أو واجهات الدردشة لقواعس البيانات، تبدو دراسة الحالة من AWS عملية: يمكنك الحصول على مولد SQL مخصص بدون تكاليف بنية تحتية مخصصة دائمة. إذا كانت سرعة الإطلاق أكثر أهمية، فإن Bedrock هي الخيار المنطقي؛ إذا كنت بحاجة إلى تحكم كامل على التدريب، فإن تركيبة SageMaker AI تبدو أقوى.

ZK
Hamidun News
أخبار الذكاء الاصطناعي بدون ضوضاء. اختيار تحريري يومي من أكثر من 400 مصدر. منتج من جمال حميدون، رئيس الذكاء الاصطناعي في Alpina Digital.

هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟

AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.

ما رأيك؟
جارٍ تحميل التعليقات…