Wired→ original

Cómo los chatbots chinos de AI se autocensuran

Un estudio conjunto de Stanford y Princeton mostró que los modelos chinos de AI son mucho más propensos que los occidentales a eludir respuestas sobre…

Procesado por IA desde Wired; editado por Hamidun News
Cómo los chatbots chinos de AI se autocensuran
Fuente: Wired. Collage: Hamidun News.
◐ Escuchar artículo

Cómo los Chatbots de IA Chinos se Censuran a Sí Mismos

Los modelos de lenguaje desarrollados en China no difieren de sus competidores occidentales solo en arquitectura o datos de entrenamiento. Difieren en lo que están dispuestos a discutir — y en lo que prefieren guardar silencio. Un nuevo estudio de investigadores de las Universidades de Stanford y Princeton documentó por primera vez sistemáticamente la escala de la autocensura incorporada en los chatbots de IA chinos, y los resultados resultaron ser más elocuentes que cualquier suposición.

Los investigadores probaron varios de los mayores modelos de lenguaje de China, haciéndoles preguntas sobre temas políticamente sensibles — desde eventos en la Plaza de Tiananmén y el estatus de Taiwán hasta la política interna del Partido Comunista Chino y los derechos humanos en Xinjiang. Los resultados se compararon con respuestas de modelos occidentales, incluyendo productos de OpenAI, Anthropic y Google. La brecha resultó ser colosal: los modelos chinos eran varias veces más propensos a negarse completamente a responder una pregunta o a proporcionar respuestas que los investigadores clasificaron como factualmente imprecisas e ideológicamente calibradas. Además, estas no eran errores aleatorios — los patrones de evasión eran tan consistentes que señalaban mecanismos de filtrado intencionalmente incorporados.

Es importante entender el contexto en el que surgió esta investigación. Las empresas de IA chinas — Baidu con su modelo Ernie, Alibaba con Qwen, DeepSeek y otras — han estado entrando agresivamente en el mercado internacional durante el último año y medio. DeepSeek a principios de 2025 causó sensación demostrando modelos comparables en calidad al GPT-4, con costos de entrenamiento significativamente menores. Estos modelos son descargados por millones de usuarios en todo el mundo, y la pregunta sobre qué visión del mundo transmiten deja de ser meramente académica.

La legislación china requiere directamente que los desarrolladores se aseguren de que sus productos de IA cumplan con los "valores socialistas fundamentales" y no socaven la autoridad del Estado. Las reglas adoptadas por la Administración del Ciberespacio de China en 2023 requieren que los servicios de IA generativa pasen por verificaciones de seguridad antes del lanzamiento en el mercado. En efecto, esto significa que la censura se incorpora en los modelos durante la etapa de desarrollo — a través del filtrado de datos de entrenamiento, ajuste fino teniendo en cuenta las "líneas rojas" y mensajes del sistema que restringen el comportamiento del modelo. El estudio de Stanford y Princeton muestra que estos mecanismos funcionan de manera efectiva y consistente.

Sin embargo, el problema va mucho más allá de la corrección política al estilo de Pekín. Cuando un modelo se entrena para evadir ciertos temas, esto inevitablemente afecta la calidad general de su razonamiento. Los investigadores señalan que los modelos chinos demostraron una precisión reducida no solo en preguntas abiertamente políticas sino también en temas relacionados — historia, geografía, relaciones internacionales. La censura incorporada en el fundamento del modelo crea una especie de "puntos ciegos" que pueden manifestarse en los contextos más inesperados. Para un usuario que recurre a un chatbot en busca de información y no es consciente de tales filtros, esto representa una amenaza real de recibir una imagen distorsionada del mundo.

Esta investigación plantea una pregunta incómoda pero necesaria ante la comunidad global de IA sobre transparencia. Los modelos occidentales tampoco están libres de limitaciones — se niegan a generar cierto contenido, evitan algunos temas y tienen sus propios sesgos incorporados en el proceso de entrenamiento. Pero existe una diferencia fundamental entre negarse a generar instrucciones para hacer explosivos y distorsionar sistemáticamente hechos históricos para adaptarse a la ideología estatal. La primera es una cuestión de seguridad; la segunda es una cuestión de manipulación de información.

Para los reguladores de todo el mundo, los resultados de este estudio deberían servir como una señal para actuar. A medida que los modelos chinos ganan popularidad fuera de la República Popular — incluido a través de pesos abiertos y políticas de precios atractivas — se necesitan estándares de transparencia que permitan a los usuarios entender qué restricciones se incorporan en el modelo que están utilizando. La Ley de IA Europea ya se está moviendo en esta dirección, pero ninguna jurisdicción ha desarrollado aún un mecanismo efectivo para auditar los sesgos ideológicos en los modelos de lenguaje.

La conclusión principal del trabajo de investigadores de Stanford y Princeton no es que los modelos chinos sean "peores" que los occidentales. Es que la IA inevitablemente refleja los valores y limitaciones del sistema en el que se crea. Y cuanto más poderosos se vuelven estos modelos, más importante es entender qué valores llevan — y qué les han enseñado a guardar silencio.

ZK
Hamidun News
Noticias de AI sin ruido. Selección editorial diaria de más de 400 fuentes. Producto de Zhemal Khamidun, Head of AI en Alpina Digital.

¿Quieres dejar de leer sobre IA y empezar a usarla?

AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.

¿Qué te parece?
Cargando comentarios…