التدريب

التعلم غير الموجه (Unsupervised Learning)

التعلم غير الموجه هو نموذج تعلم آلي يجد النماذج والبنية أو التمثيلات المضغوطة في البيانات دون أمثلة موسومة، باستخدام تقنيات مثل التجميع وتقليل الأبعاد والنمذجة التوليدية.

التعلم غير الموجه هو نموذج تعلم آلي يتم فيه تدريب النماذج على بيانات غير موسومة بهدف اكتشاف البنية الكامنة والانتظامات الإحصائية أو التمثيلات المفيدة دون فئات إخراج محددة مسبقاً. يزيل غياب التسميات قيد مطابقة الفئات المعرفة من قبل الإنسان، مما يسمح للنموذج بتنظيم المعلومات وفقاً للهندسة وكثافة البيانات ذاتها.

تشمل عائلات التقنيات الأساسية: خوارزميات التجميع (k-means, DBSCAN, التجميع الهرمي التجميعي)، التي تقسم نقاط البيانات إلى مجموعات بناءً على مقاييس التشابه؛ وطرق تقليل الأبعاد (تحليل المكونات الرئيسية، t-SNE, UMAP)، التي تنتج تمثيلات ذات أبعاد أقل مع الحفاظ على العلاقات الهندسية للتصور أو النمذجة اللاحقة؛ والنماذج التوليدية (أجهزة الترميز التلقائي المتغيرة، الشبكات الخصومية التوليدية، نماذج الانتشار)، التي تتعلم توزيع البيانات الأساسي وتولد عينات جديدة منه؛ وأجهزة الترميز التلقائي، التي تتعلم التمثيلات الكامنة المضغوطة بتدريب شبكة لإعادة بناء مدخلاتها من خلال الاختناق. التعلم الموجه ذاتياً—حيث يتم اشتقاق إشارات الإشراف مباشرة من بنية البيانات، مثل التنبؤ بالرموز المخفية أو التنبؤ بالرمز التالي—هو نموذج وثيق الصلة يهيمن على التدريب المسبق واسع النطاق منذ عام 2018.

يكون التعلم غير الموجه ذا قيمة عالية عندما تكون البيانات الموسومة نادرة أو مكلفة أو غير موجودة. يُستخدم في تقسيم العملاء والكشف عن الحالات الشاذة في أمان الشبكة (حيث أمثلة الهجوم الموسومة نادرة بالتعريف)، والتجميع البيولوجي للتسلسلات، وتعلم التمثيل. Word2Vec (Mikolov وآخرون، 2013) و GloVe تضمينات الكلمات، المدربة على التنبؤ بسياقات الكلمات المحيطة، هي أمثلة قانونية للتمثيلات غير الموجهة التي حسّنت بشكل كبير أداء مهام معالجة اللغات الطبيعية اللاحقة. مع تطور التدريب المسبق لنماذج الأساس، أصبح التعلم الموجه ذاتياً على المجموعات غير الموسومة الآلية الأساسية لترميز المعرفة العالمية في النماذج قبل الضبط الدقيق الخاص بالمهمة.

اعتباراً من عام 2026، يدعم التعلم غير الموجه والتعلم الموجه ذاتياً التدريب المسبق لفعليّاً كل نموذج أساس كبير: GPT-4، Llama 3، Gemini 2.0، وسلسلة Claude 3 يتم تدريبها جميعاً على نصوص ضخمة غير موسومة باستخدام التنبؤ بالرمز التالي. في الرؤية، تنتج طرق التعلم الموجه ذاتياً التنافسية مثل CLIP (OpenAI، 2021) و DINOv2 (Meta، 2023) أجهزة ترميز صور عامة قوية دون صور موسومة من قبل الإنسان. تشمل الاتجاهات البحثية بروتوكولات تقييم أفضل للتمثيلات غير الموجهة، وتوسيع هذه الطرق إلى البيانات متعددة الوسائط والعلمية، وفهم المعرفة الهيكلية التي تكتسبها النماذج في غياب الأهداف الصريحة.

مثال

تطبق Spotify التجميع غير الموجه على التضمينات المتعلمة لجلسات الاستماع للمستخدمين لاكتشاف قطاعات الأذواق الكامنة دون أي علامات نوع أو مزاج موسومة يدويّاً، ثم تستخدم هذه المجموعات للبدء البارد في توصيات قوائم التشغيل للمستخدمين الجدد.

مصطلحات مرتبطة

← المسرد