Comment les chatbots chinois d’AI s’autocensurent
Une étude conjointe de Stanford et Princeton a montré que les modèles chinois d’AI évitent bien plus souvent que les modèles occidentaux de répondre aux…
Traité par IA depuis Wired ; édité par Hamidun News
Comment les Chatbots IA Chinois se Censurent eux-mêmes
Les modèles de langage développés en Chine ne diffèrent de leurs concurrents occidentaux non seulement par l'architecture ou les données d'entraînement. Ils diffèrent par ce qu'ils sont disposés à discuter — et ce sur quoi ils préfèrent rester silencieux. Une nouvelle étude de chercheurs des universités de Stanford et de Princeton a documenté pour la première fois systématiquement l'ampleur de l'autocensure intégrée dans les chatbots IA chinois, et les résultats se sont avérés plus éloquents que toute supposition.
Les chercheurs ont testé plusieurs des plus grands modèles de langage de Chine, en leur posant des questions sur des sujets politiquement sensibles — des événements de la place Tiananmen et du statut de Taïwan à la politique interne du Parti communiste chinois et aux droits de l'homme au Xinjiang. Les résultats ont été comparés aux réponses de modèles occidentaux, incluant les produits d'OpenAI, Anthropic et Google. L'écart s'est avéré colossal : les modèles chinois étaient plusieurs fois plus susceptibles de refuser complètement de répondre à une question ou de fournir des réponses que les chercheurs ont classées comme factuellement inexactes et idéologiquement calibrées.
De plus, il ne s'agissait pas d'erreurs aléatoires — les modèles d'évasion étaient tellement cohérents qu'ils pointaient vers des mécanismes de filtrage intentionnellement intégrés.
Il est important de comprendre le contexte dans lequel cette recherche a émergé. Les entreprises IA chinoises — Baidu avec son modèle Ernie, Alibaba avec Qwen, DeepSeek et autres — ont agressivement pénétré le marché international au cours des dix-huit derniers mois. DeepSeek au début de 2025 a fait sensation en démontrant des modèles comparables en qualité à GPT-4, avec des coûts d'entraînement significativement inférieurs. Ces modèles sont téléchargés par des millions d'utilisateurs dans le monde, et la question de la vision du monde qu'ils véhiculent cesse d'être purement académique.
La législation chinoise exige directement que les développeurs s'assurent que leurs produits IA se conforment aux « valeurs socialistes fondamentales » et ne sapent pas l'autorité de l'État. Les règles adoptées par l'Administration du cyberespace de Chine en 2023 exigent que les services d'IA génératives passent par des contrôles de sécurité avant leur lancement sur le marché. Concrètement, cela signifie que la censure est intégrée aux modèles pendant la phase de développement — par le filtrage des données d'entraînement, l'ajustement fin avec les « lignes rouges » en tête et les invites système qui restreignent le comportement du modèle. L'étude de Stanford et Princeton montre que ces mécanismes fonctionnent de manière efficace et cohérente.
Cependant, le problème va bien au-delà de la correction politique à la pékinoise. Quand un modèle est entraîné à éluder certains sujets, cela affecte inévitablement la qualité générale de son raisonnement. Les chercheurs notent que les modèles chinois ont démontré une précision réduite non seulement sur les questions ouvertement politiques mais aussi sur les sujets connexes — histoire, géographie, relations internationales. La censure intégrée au fondement du modèle crée une sorte de « zones aveugles » qui peuvent se manifester dans les contextes les plus inattendus. Pour un utilisateur qui se tourne vers un chatbot pour obtenir des informations et ignore l'existence de tels filtres, cela représente une menace réelle de recevoir une image déformée du monde.
Cette recherche pose à la communauté mondiale de l'IA une question inconfortable mais nécessaire sur la transparence. Les modèles occidentaux ne sont pas non plus libres de limitations — ils refusent de générer certains contenus, évitent certains sujets et ont leurs propres biais intégrés dans le processus d'entraînement. Mais il existe une différence fondamentale entre refuser de générer des instructions pour fabriquer des explosifs et déformer systématiquement des faits historiques pour servir l'idéologie d'État. La première relève de la sécurité, la seconde relève de la manipulation de l'information.
Pour les régulateurs du monde entier, les résultats de cette étude devraient servir de signal pour agir. À mesure que les modèles chinois gagnent en popularité en dehors de la RPC — y compris grâce aux poids ouverts et aux politiques tarifaires attractives — des normes de transparence sont nécessaires qui permettront aux utilisateurs de comprendre quelles restrictions sont intégrées au modèle qu'ils utilisent. La loi IA européenne se dirige déjà dans cette direction, mais aucune juridiction n'a encore développé un mécanisme efficace pour auditer les biais idéologiques dans les modèles de langage.
La conclusion principale du travail des chercheurs de Stanford et de Princeton n'est pas que les modèles chinois sont « pires » que les modèles occidentaux. C'est que l'IA reflète inévitablement les valeurs et les limitations du système dans lequel elle est créée. Et plus ces modèles deviennent puissants, plus il est important de comprendre quelles valeurs ils véhiculent — et ce qu'on leur a appris à taire.
Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?
AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.