معهد ماساتشوستس للتكنولوجيا يقدم WRING — طريقة لتقليل الانحياز في نماذج الذكاء الاصطناعي للرؤية بدون تشويهات جديدة

قدم معهد ماساتشوستس للتكنولوجيا ومعهد وستر بوليتكنك و Google نموذج WRING — طريقة جديدة لإزالة الانحياز في نماذج الرؤية واللغة مثل CLIP. بدلاً من "إزالة" الميزات المنحازة من التضمينات، تقوم الطريقة بتدويرها في الفضاء الجزئي المناسب. هذا يساعد على إزالة الانحياز المستهدف دون تعزيز التشويهات الخفية الأخرى، ويجعل الطريقة قابلة للتطبيق على النماذج المدربة مسبقاً دون إعادة تدريب مكلفة.

Khamidun Zhemal

رصد الذكاء الاصطناعي · MIT News

30 أبريل 2026· 3 د

معالج بواسطة الذكاء الاصطناعي من MIT News؛ بتحرير Hamidun News

معهد ماساتشوستس للتكنولوجيا يقدم WRING — طريقة لتقليل الانحياز في نماذج الذكاء الاصطناعي للرؤية بدون تشويهات جديدة — المصدر: MIT News. كولاج: Hamidun News.

◐ استمع للمقال

قدمت معهد ماساتشوستس للتكنولوجيا وورسستر بوليتكنك إنستيتيوت وجوجل WRING — طريقة جديدة لتقليل التحيز في نماذج الرؤية واللغة. يجب أن تحل مشكلة قديمة في إزالة التحيز: إزالة تحيز واحد دون إنشاء آخر في مكان آخر في النموذج.

لماذا تفشل الطرق القديمة

لقد تجاوز التحيز في الرؤية الحاسوبية منذ وقت طويل النقاش الأكاديمي. إذا ساعد نموذج طبيب الجلدية على تقييم صور الجلد، فإن التحيز تجاه لون جلد معين قد يؤدي إلى إغفال المخاطر. ينطبق الشيء ذاته على البحث عن الصور وتصنيف الكائنات وأي نظام يربط النموذج بين الصور والنص.

يذكرنا باحثو معهد ماساتشوستس للتكنولوجيا بأن التحيز لا يأتي فقط من البيانات، بل أيضاً من كيفية تنظيم النموذج ذاته للاتصالات داخل التضمينات. الطريقة الأكثر شيوعاً للتعامل مع هذا هي إزالة التحيز بالإسقاط. بشكل مبسط، يتم "قطع" اتجاه من تمثيل النموذج يتوافق مع ميزة غير مرغوبة.

على الورقة يبدو منطقياً، لكن في الممارسة العملية ينتج عنه تأثير يسميه الباحثون معضلة Whac-a-mole: تزيل تحيزاً واحداً ويظهر آخر في مكان آخر. على سبيل المثال، إذا ضعفت التحيز العرقي في نموذج يختار صور الموظفين الطبيين، فقد تقوي عن غير قصد التحيز القائم على النوع الاجتماعي. يتوقف النموذج عن استخدام اختصار واحد لكنه يبدأ بالاعتماد أكثر على آخر.

ما الذي يفعله WRING

WRING، أو Weighted Rotational DebiasING، يقترح عدم قطع قطعة من مساحة الميزات، بل تدوير الإحداثيات اللازمة بعناية ضمن الفضاء الفرعي ذي الصلة. الفكرة هي أن يتوقف النموذج عن تمييز المجموعات حيث ينشئ تحيزاً غير مرغوب، مع عدم فقدان الاتصالات المفيدة الأخرى. إذا كان الإسقاط العادي يغير الهندسة حول الميزة المستهدفة بطريقة خشنة إلى حد ما، فإن WRING يحاول الحفاظ عليها سليمة قدر الإمكان.

"عندما تزيل ببساطة التحيز، فإنك تضغط دون قصد على كل شيء حوله"، هكذا

يصف المؤلفون ضعف النهج القديمة.

من الناحية العملية، هذا يعني أنه يمكن تطبيق الطريقة على نماذج الرؤية واللغة المدربة بالفعل مثل CLIP أو OpenCLIP دون إعادة التدريب من الصفر. بالنسبة للصناعة هذه نقطة مهمة: النماذج متعددة الوسائط الكبيرة مكلفة، وقلة قليلة على استعداد لإعادة تشغيل خط أنابيب التدريب بالكامل من أجل خطوة تصحيحية واحدة. يعمل WRING كنهج معالجة لاحقة، مما يعني أنه يتم تطبيقه على نموذج مكتمل ويمكن استخدامه "بسرعة البرق" في سيناريوهات البحث والترتيب أو تصنيف الصور.

ما أظهرته الاختبارات

تم قبول العمل في ICLR 2026، وفي التجارب قارن المؤلفون WRING مع نهج الإسقاط المألوفة على أربع مجموعات بيانات. في حالتين كان هناك تحيزات عرقية وجنسانية؛ في حالة أخرى، صور للكلاب حيث يخلط النموذج بين الكائن ذاته والخلفية؛ وفي حالة أخرى، ملابس حيث امتزجت اللون والموسمية والجمعيات القائمة على النوع الاجتماعي.

الخلاصة العامة: قلل WRING بشكل ملحوظ التحيز على السمة المستهدفة ولم يسرع التحيزات المخفية في اتجاهات أخرى.

بالنسبة لصور الكلاب، أزالت الطريقة الارتباط بالخلفية دون تضخيم التحيز بناءً على السلالة.
بالنسبة لللقطات التي تحتوي على أشخاص، قللت التحيز المستهدف دون نمو ثانوي لجمعيات حساسة أخرى.
بالنسبة للملابس، حافظت على المزيد من بنية النموذج الأصلية مقارنة بإزالة الميزات بالإسقاط.
الطريقة لا تتطلب إعادة تدريب وبالتالي يسهل تنفيذها في خطوط الأنابيب القيد التشغيل بالفعل.

للنهج حد: حالياً تعمل بشكل أفضل لنماذج التباعد من نوع CLIP حيث تعيش الصور والنص في مساحة تضمين مشتركة. الخطوة المنطقية التالية، التي يسميها المؤلفون ذاتهم ذات أولوية، هي نقل الفكرة إلى نماذج اللغة التوليدية على طريقة ChatGPT. إذا نجح هذا، يمكن لـ WRING أن يصبح ليس أداة متخصصة لرؤية الحاسوب، بل طريقة أكثر عمومية لإصلاح التحيز في أنظمة الذكاء الاصطناعي المدربة بالفعل بطريقة أكثر أماناً.

ما الذي يعنيه هذا

WRING مثير للاهتمام ليس لأنه يعد بـ "حل التحيز بالكامل"، بل لأنه يقدم حلاً هندسياً أكثر حذراً. بالنسبة للفرق التي تستخدم بالفعل نماذج من نوع CLIP في الطب أو البحث أو الاعتدال، هذا مسار عملي لتقليل التحيزات دون إعادة تدريب مكلفة وبدون خطر إلحاق الضرر عن غير قصد بخصائص النموذج المجاورة.

Hamidun News

أخبار الذكاء الاصطناعي بدون ضوضاء. اختيار تحريري يومي من أكثر من 50 مصدر. منتج من جمال حميدون، رئيس الذكاء الاصطناعي في Alpina Digital.

قناة Telegram RSS hamidun.com

هل تحتاج إلى ذكاء اصطناعي يعمل داخل شركتك — وليس فقط في موجز الأخبار؟

أبني ذكاءً اصطناعياً جاهزاً للإنتاج للشركات — أنظمة CRM مخصّصة، أدوات داخلية، وكلاء مستقلون، أتمتة سير العمل. ملك لك، مصمّم وفق عمليتك، دون رسوم لكل مستخدم. من إعداد جمال خميدون، مدير المنتجات في AlpinaGPT (منصة ذكاء اصطناعي، أكثر من 6000 مستخدم).

احجز استشارة مجانية →