MIT presenta WRING — un método para reducir el sesgo en modelos de IA de visión sin nuevas distorsiones
MIT, Worcester Polytechnic Institute y Google presentaron WRING — un nuevo método para eliminar sesgos en modelos de visión-lenguaje como CLIP. En lugar de…
Procesado por IA desde MIT News; editado por Hamidun News
MIT, Worcester Polytechnic Institute y Google presentaron WRING — un nuevo método para reducir el sesgo en modelos vision-language. Debe resolver un antiguo problema de dessesgado: eliminar un sesgo sin crear otro en otra parte del modelo.
Por qué los métodos antiguos fallan
El sesgo en visión por computadora ha salido desde hace mucho del debate académico. Si un modelo ayuda a un dermatólogo a evaluar imágenes de piel, un sesgo hacia un tono de piel específico podría llevar a riesgos pasados por alto. Lo mismo se aplica a la búsqueda de imágenes, clasificación de objetos y cualquier sistema donde el modelo vincula imágenes a texto.
Los investigadores del MIT nos recuerdan que el sesgo proviene no solo de los datos, sino también de cómo el modelo mismo organiza las conexiones dentro de los embeddings. La forma más popular de combatir esto es el dessesgado por proyección. Simplificando, de la representación del modelo se "corta" una dirección que corresponde a una característica no deseada.
En el papel parece lógico, pero en la práctica produce un efecto que los investigadores llaman la dilema Whac-a-mole: eliminas un sesgo y otro aparece en otro lugar. Por ejemplo, si debilitas el sesgo racial en un modelo que selecciona imágenes de personal médico, podrías accidentalmente fortalecer sesgo de género. El modelo deja de usar un atajo pero comienza a depender más de otro.
Lo que hace WRING
WRING, o Weighted Rotational DebiasING, propone no cortar un pedazo del espacio de características, sino girar cuidadosamente las coordenadas necesarias dentro del subespacio relevante. La idea es que el modelo deje de distinguir grupos donde crea sesgo no deseado, mientras no pierde otras conexiones útiles. Si la proyección normal cambia la geometría alrededor de la característica objetivo de forma bastante tosca, WRING intenta mantenerla lo más intacta posible.
"Cuando simplemente eliminas el sesgo, involuntariamente comprimes
todo a su alrededor", es como los autores describen la debilidad de los enfoques antiguos.
En la práctica, esto significa que el método puede aplicarse a modelos vision-language ya entrenados como CLIP u OpenCLIP sin reentrenamiento desde cero. Para la industria este es un punto importante: los modelos multimodales grandes son costosos, y pocos están dispuestos a re-ejecutar todo el pipeline de entrenamiento por un paso correctivo. WRING funciona como un enfoque post-procesamiento, lo que significa que se superpone a un modelo terminado y puede usarse "sobre la marcha" en escenarios de búsqueda, clasificación o categorización de imágenes.
Lo que mostraron las pruebas
El trabajo fue aceptado en ICLR 2026, y en los experimentos los autores compararon WRING con enfoques de proyección familiares en cuatro conjuntos de datos. En dos casos había sesgos raciales y de género; en otro, fotografías de perros donde el modelo confundía el objeto mismo con el fondo; y en otro, ropa donde se mezclaban color, estacionalidad y asociaciones de género.
La conclusión general: WRING reducía significativamente el sesgo en el atributo objetivo y no aceleraba sesgos ocultos en otras direcciones.
- Para imágenes de perros, el método eliminaba la vinculación al fondo sin amplificar sesgo de raza.
- Para fotogramas con personas, reducía sesgo objetivo sin crecimiento secundario de otras asociaciones sensibles.
- Para ropa, preservaba más de la estructura del modelo original que la eliminación de características por proyección.
- El método no requiere reentrenamiento y por lo tanto es más fácil de implementar en pipelines ya en ejecución.
El enfoque tiene una limitación: actualmente funciona mejor para modelos contrastivos tipo CLIP donde imágenes y texto viven en un espacio de embedding compartido. El siguiente paso lógico, que los autores mismos llaman prioritario, es transferir la idea a modelos de lenguaje generativos al estilo ChatGPT. Si esto funciona, WRING podría convertirse no en una herramienta de nicho para visión por computadora, sino en una forma más general de solucionar sesgos en sistemas AI ya entrenados de forma más segura.
Lo que significa
WRING es interesante no porque promete "resolver completamente el sesgo", sino porque ofrece un compromiso ingenieril más cuidadoso. Para equipos que ya usan modelos tipo CLIP en medicina, búsqueda o moderación, este es un camino práctico para reducir sesgos sin reentrenamiento costoso y sin el riesgo de dañar accidentalmente propiedades vecinas del modelo.
¿Quieres dejar de leer sobre IA y empezar a usarla?
AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.