The Verge→ original

Des éditeurs attaquent Meta pour avoir entraîné Llama sur des copies illégales de livres et de revues

Des éditeurs ont porté plainte contre Meta pour avoir entraîné Llama sur des copies illégales. Cinq grands éditeurs (Macmillan, McGraw Hill, Elsevier, Hachette,

Des éditeurs attaquent Meta pour avoir entraîné Llama sur des copies illégales de livres et de revues
Source : The Verge. Collage: Hamidun News.
◐ Écouter l'article

Meta a été poursuivie en justice par cinq grands éditeurs et l'écrivain Scott Turow. L'accusation est grave : l'entreprise aurait commis « l'une des plus grandes violations de droits d'auteur de l'histoire » en entraînant le modèle Llama sur des copies piratées de livres et de revues scientifiques.

Comment Meta a Entraîné Llama

Meta a délibérément copié des livres et des revues scientifiques sur des sites de piraterie (LibGen, Anna's Archive, Sci-Hub, Sci-Mag et autres) et a utilisé ce matériel pour entraîner Llama sans la permission des auteurs et des titulaires de droits. Les éditeurs affirment dans la plainte que cela a été fait intentionnellement, et non par accident. La logique était simple : les sites de piraterie fournissent du contenu gratuitement, tandis que les licences coûtent de l'argent.

Meta a choisi une solution économiquement rationnelle — contourner les canaux légaux d'acquisition de contenu et télécharger directement à partir de sources illégales. Ce n'était pas un incident isolé. Nous parlons d'un processus systématique : rechercher des sites de piraterie, télécharger, charger dans l'ensemble de données d'entraînement.

L'entreprise savait ce qu'elle faisait, et elle l'a fait délibérément.

Qui a Déposé la Plainte

La plainte a été déposée par cinq des plus grands éditeurs du monde :

  • Macmillan — fiction, manuels scolaires, publications scientifiques
  • McGraw Hill — littérature professionnelle et contenu éducatif
  • Elsevier — revues scientifiques dans le monde entier
  • Hachette — l'un des « Big Five » éditeurs américains
  • Cengage — contenu éducatif et manuels scolaires

Plus l'écrivain Scott Turow, auteur des best-sellers « The Burden of Proof » et « Presumed Innocent ». C'est un moment important : ce n'est pas simplement un différend d'entreprise sur l'argent. Dans la plainte, il y a une voix distincte d'un auteur, ce qui donne de la légitimité et du poids émotionnel aux réclamations. La question ne concerne pas seulement les profits des entreprises, mais aussi les droits des créateurs individuels.

Pourquoi C'est Important

En surface, il s'agit d'un différend juridique sur l'argent et les droits d'auteur. En réalité, il s'agit des règles du jeu à l'ère de l'IA. La question est simple : si Meta peut télécharger du contenu d'autres personnes sur des sites de piraterie et s'y entraîner sans conséquences, pourquoi les auteurs et les éditeurs devraient-ils faire confiance à la protection de leurs œuvres ?

La plainte établit un précédent : les entreprises d'IA ne peuvent pas s'approprier le contenu créatif impunément.

« C'est l'un des plus grands cas de violation de droits d'auteur de

l'histoire », déclare la plainte.

Comment Cela Se Développera

Le procès pourrait durer des années. Meta se défendra probablement en invoquant l'utilisation équitable ou en arguant que le contenu des sites de piraterie est déjà dans le domaine public. Mais de tels arguments sont faibles dans ce contexte : l'entreprise a délibérément choisi une source de contenu illégal, le savait et n'a pas tenté de négocier. Même si le procès est long, il change déjà la dynamique du marché. D'autres entreprises d'IA (OpenAI, Google, Microsoft, Anthropic) commenceront probablement à se distancer de l'utilisation de contenu clairement illégal et à passer aux licences. Les éditeurs exigeront une compensation pour l'utilisation de leurs œuvres dans l'entraînement de grands modèles de langage.

Ce Que Cela Signifie

Cette plainte est un symbole de la fin d'une ère d'« entraînement gratuit » silencieux sur le contenu d'autrui. Auparavant, de telles choses se produisaient dans l'ombre, maintenant elles sont sous les yeux du public. Deux choses se produiront probablement simultanément : certaines entreprises négocieront avec les éditeurs et les auteurs (et paieront pour les données), tandis que d'autres perdront au tribunal (et paieront encore plus). En conséquence, le marché sera restructuré selon les nouvelles règles. L'IA ne sera pas une technologie « gratuite », mais nécessitera des licences et des paiements. Cela peut ralentir le développement de l'IA, mais c'est juste pour ceux dont le travail est utilisé dans l'entraînement.

ZK
Hamidun News
Actualités IA sans bruit. Sélection éditoriale quotidienne de plus de 400 sources. Produit de Zhemal Khamidun, Head of AI chez Alpina Digital.
Qu'en pensez-vous ?
Chargement des commentaires…