AWS تشرح كيفية تسريع ضبط Llama 3.2 Vision على بيانات S3
عرضت AWS ليس نموذجاً جديداً، بل طريقة عملية لضبط أسرع للنماذج اللغوية الكبيرة متعددة الأنماط على بيانات S3. يربط الفريق في المثال بين SageMaker Unified…
معالج بواسطة الذكاء الاصطناعي من AWS Machine Learning Blog؛ بتحرير Hamidun News
قدمت AWS سيناريو عملي للعمل مع البيانات غير المنظمة في نظام SageMaker البيئي. وصفت الشركة كيفية ربط Amazon S3 مع SageMaker Catalog و Unified Studio، ثم استخدام هذا المسار لضبط نموذج Llama 3.2 11B Vision Instruct لمهام الإجابة على الأسئلة البصرية.
كيفية عمل التكامل
في جوهر هذه الحالة يكمن تكامل أعلنت عنه AWS في العام الماضي: Amazon SageMaker Unified Studio يمكنه العمل مع حاويات S3 العادية، وليس فقط مع مجموعات البيانات المحضرة بشكل منفصل ضمن سير عمل ML. بالنسبة للفرق، هذا يمثل تحولاً مهماً، لأن معظم المواد القيمة مخزنة في object storage: الصور وملفات PDF والماسحات الضوئية والعروض التقديمية والمستندات الخدمية والتصديرات وملفات أخرى غير منظمة. في السابق، كان هناك في كثير من الأحيان طبقة يدوية غير ضرورية بين التخزين وتدريب النموذج: نقل البيانات والتكرار والتعليق والفهرسة المنفصلة.
الآن تعرض AWS نهجاً أكثر مباشرة. يعمل S3 كتخزين أساسي، و SageMaker Catalog يساعد في وصف وتنظيم البيانات، و Unified Studio يصبح مساحة عمل مشتركة للمحللين ومهندسي ML. في هذا النهج، لا تقف البيانات فقط "في حاوية"—بل تصبح موارد يمكن الوصول إليها وإدارتها ضمن خط الأنابيب.
هذا يقلل الاحتكاك بين الفرق ويسمح بانتقال أسرع من الملفات الخام إلى تجارب النماذج، دون بناء بنية تحتية منفصلة لكل مشروع.
ما يوضحه المثال
استخدمت AWS نموذج Llama 3.2 11B Vision Instruct ومهمة الإجابة على الأسئلة البصرية (VQA) كتوضيح. هذا سيناريو حيث يجب على النموذج النظر إلى صورة والإجابة على أسئلة حول محتواها.
تحدث مثل هذه المهام بشكل شائع في معالجة المستندات والتجارة الإلكترونية وخدمة العملاء والفحوصات وقواعد المعرفة الداخلية، حيث يكون من المهم ليس فقط تخزين الصورة، بل استخراج الإجابات منها بصيغة نصية مفهومة. بالنسبة لهذا النوع من الضبط الدقيق، من الأساسي بشكل خاص أن تكون البيانات البصرية والتعليقات المصاحبة لها مجمعة في سير عمل واضح. تكمن القيمة العملية لهذا المنشور في تركيز AWS ليس على معايير الأداء للنموذج، بل على سرعة تجميع عملية العمل.
بالنسبة للعديد من الشركات، الاختناق ليس اختيار نموذج LLM، بل المسار من "لدينا أرشيف ملفات" إلى "أطلقنا الضبط الدقيق لمهمة عمل محددة". التكامل S3 مع Catalog و Unified Studio يختصر هذا المسار. بدلاً من الخطوات اليدوية المجزأة، تحصل الفريق على عملية أكثر ربطاً يسهل تكرارها وتوثيقها وتوسيع نطاقها على مجموعات بيانات أخرى.
- يمكنك استخدام حاويات S3 الموجودة دون هجرة منفصلة إلى تخزين جديد
- يحصل الفريق على مساحة موحدة للعمل مع البيانات والتحليلات وتجارب ML
- من الأسهل تحويل الملفات غير المنظمة إلى مجموعات بيانات قابلة لإعادة الاستخدام
- يمكن تكييف النماذج متعددة الأشكال للسيناريوهات التطبيقية مثل VQA
- تقليل حجم العمليات اليدوية بين تخزين البيانات وإطلاق الضبط الدقيق
مع ذلك، لا تعد AWS بأن الضبط الدقيق يصبح مهمة "بنقرة واحدة". تعتمد جودة النتائج دائماً على التعليق والبيانات النظيفة وصياغة المشكلة وكيف يتم اختيار مجموعة الأمثلة الأساسية بشكل جيد. لكن البنية التحتية نفسها تصبح أبسط: يتوقف object storage عن كونه أرشيفاً سلبياً ويصبح مصدراً نشطاً لـ ML والتحليل. بالنسبة للشركات التي لديها كميات كبيرة من الصور والمستندات، قد يقلل هذا بشكل ملحوظ من الوقت اللازم للحصول على النموذج الأول المفيد.
ما تعنيه هذه
تنقل AWS السوق بعيداً عن النقاشات المجردة حول قدرات النماذج نحو التجميع العملي لخطوط أنابيب البيانات إلى النموذج. بالنسبة للعمل، الخلاصة بسيطة: يتم إنشاء الميزة بشكل متزايد ليس فقط باختيار نموذج LLM قوي، بل بالسرعة التي يمكن لفريق العمل فيها ربط بياناته غير المنظمة الخاصة به ووصفها وتحويلها إلى سير عمل مُدار للضبط الدقيق القابل للتكرار. كلما قل عدد نقاط الاتصال اليدوية بين التخزين والفهرس والتدريب، كلما ظهرت نماذج تطبيقية بشكل أسرع للعمليات المحددة.
هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟
AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.