Britannica et Merriam-Webster poursuivent OpenAI pour près de 100 000 articles
Britannica et Merriam-Webster ont déposé une plainte contre OpenAI à New York. Les éditeurs affirment que l'entreprise a utilisé leurs contenus de référence…
Traité par IA depuis TNW ; édité par Hamidun News
Encyclopedia Britannica et Merriam-Webster ont poursuivi OpenAI à New York, affirmant que l'entreprise a utilisé leurs matériaux pour entraîner ChatGPT sans permission. Selon les éditeurs, le bot ne s'appuie pas seulement sur leurs textes de référence, mais il est également capable de reproduire des fragments de près de 100 000 articles de manière trop fidèle à l'original.
Quels Sont les Griefs ?
Le procès a été déposé le 13 mars 2026 à New York. Britannica et Merriam-Webster accusent OpenAI sur deux fronts : violation de droits d'auteur et utilisation de leurs marques dans un contexte qui, selon eux, induit les utilisateurs en erreur. Il ne s'agit pas de quelques réponses litigieuses, mais d'un ensemble de matériaux que les éditeurs ont passé des décennies à collecter, éditer et monétiser en tant que produit de référence. Maintenant, selon les plaignants, cette base de connaissances aide à entraîner une interface concurrente sans licence et sans compensation.
Une partie clé des griefs ne concerne pas seulement l'entraînement du modèle lui-même, mais aussi ce qui se passe en sortie. Les éditeurs affirment que ChatGPT est capable de produire des réponses qui, selon eux, reproduisent parfois leurs articles presque mot pour mot. Pour les marques de référence, c'est particulièrement problématique : si un utilisateur obtient une définition toute prête, une explication ou une référence historique directement dans le chat, il a moins de raisons de visiter le site Web, d'acheter un abonnement ou d'interagir avec l'éditeur original.
Ce que les Éditeurs Soulèvent
Au cœur du différend se trouve un conflit typique de l'IA générative : la thèse que « le modèle apprend à partir de données générales » par rapport à l'accusation que le produit finit par remplacer la source originale. Dans le cas de Britannica et Merriam-Webster, les plaignants tentent de démontrer précisément la deuxième logique : la valeur est créée par eux, mais l'utilisateur final reçoit un résultat de référence presque prêt déjà dans ChatGPT. Par conséquent, la plainte s'articule autour de plusieurs thèmes récurrents :
- utilisation de leurs matériaux de référence pour entraîner le modèle sans permission ;
- les réponses de ChatGPT qui, selon eux, reproduisent parfois les articles presque mot pour mot ;
- l'ampleur des griefs — près de 100 000 articles et matériaux ;
- le risque qu'un utilisateur obtienne de la valeur dans le chat et ne parvienne jamais à la ressource originale ;
- les griefs relatifs aux marques si la marque de l'éditeur aide à légitimer une réponse créée par quelqu'un d'autre.
Les éditeurs de référence occupent une position particulière dans ce différend. Leur contenu est court, structuré, factuel et conçu pour fournir une réponse directe à une question — précisément ce format est particulièrement pratique pour les grands modèles de langage. Par conséquent, le conflit ici paraît plus grave que dans le cas de longues colonnes ou de textes littéraires : un article d'encyclopédie ou une entrée de dictionnaire coïncide presque parfaitement avec ce qu'un utilisateur attend d'un chatbot en un clic.
Pourquoi le Différend S'intensifie
La nouvelle action n'est pas née de nulle part. Environ six mois auparavant, les mêmes entreprises avaient déjà déposé une action similaire contre Perplexity. Cela montre qu'il ne s'agit pas d'un conflit isolé avec une seule plateforme, mais d'une stratégie plus large : les éditeurs veulent contester l'approche même selon laquelle les services d'IA construisent une interface de réponse sur les archives d'autrui, puis conservent le public. Si cette logique s'établit dans les tribunaux, la pression pèsera non seulement sur les chatbots mais aussi sur les réponses de moteurs de recherche de nouvelle génération. Il s'agit d'un test important des limites acceptables du marché.
Une chose est quand un modèle apprend statistiquement à partir d'un grand corpus de textes et formule une nouvelle réponse avec ses propres mots. Une autre est quand il reproduit des fragments reconnaissables ou remplace efficacement un produit de référence payant. Le tribunal devra probablement démêler plusieurs dimensions à la fois : où finit l'apprentissage et où commence la copie, dans quelle mesure les références à une marque bien connue sont-elles appropriées, et si de telles réponses peuvent être considérées comme un remplacement direct du contenu original.
OpenAI, comme les autres développeurs de modèles, opère déjà dans un environnement où la pression des titulaires de droits ne cesse de croître. Pour l'entreprise, ce procès est particulièrement désagréable car il est intenté non pas simplement par les médias ou des auteurs individuels, mais par deux marques de référence classiques dont la valeur est fondée sur la précision, l'édition et la confiance dans leurs formulations. Si les plaignants parviennent à démontrer de manière convaincante la reproduction systématique du contenu, cela renforcera la position de ceux qui exigent que les entreprises d'IA concluent des licences pour les données plutôt que de les prendre par défaut.
Ce Que Cela Signifie
L'affaire Britannica et Merriam-Webster montre que la question juridique principale autour de l'IA générative passe de l'abstrait « peut-on apprendre à partir de textes d'autrui ? » à la plus pratique « peut-on alors remplacer le produit d'autrui avec ceci ? ». Si le tribunal voit ChatGPT non seulement comme un outil de synthèse mais comme un concurrent direct des publications de référence, la pression sur le marché pour les licences, les partenariats et les restrictions sur la sortie des réponses augmentera considérablement.
Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?
AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.