Ars Technica→ original

Wikipédia ouvre son contenu aux entreprises d'IA par le biais d'accords de licence

Wikipedia, l'une des plus grandes sources de connaissances au monde, ouvre ses portes à l'intelligence artificielle. Wikimedia Enterprise, la division…

Traité par IA depuis Ars Technica ; édité par Hamidun News
Wikipédia ouvre son contenu aux entreprises d'IA par le biais d'accords de licence
Source : Ars Technica. Collage: Hamidun News.
◐ Écouter l'article

Wikipedia, l'une des plus grandes sources de connaissances au monde, ouvre ses portes à l'intelligence artificielle. Wikimedia Enterprise, la division commerciale de la Fondation Wikimedia, a conclu une série d'accords de licence avec des géants de la technologie tels que Microsoft, Meta, Amazon, ainsi qu'avec les startups prometteuses Perplexity AI et Mistral AI. Ces accords donnent aux entreprises d'IA accès à la vaste base de données de Wikipedia pour entraîner et améliorer leurs modèles.

Pendant longtemps, Wikipedia est restée une ressource libre et ouverte accessible à tous. Cependant, avec la popularité croissante des grands modèles de langage (LLMs), la demande de données de haute qualité pour les entraîner a augmenté considérablement. Wikimedia Enterprise a vu une opportunité de monétiser son contenu tout en maintenant les principes d'ouverture et d'accessibilité qui sous-tendent Wikipedia. Les licences payantes fournissent aux entreprises un accès structuré et optimisé aux données, ainsi qu'un support technique, ce qui simplifie considérablement le processus d'entraînement des modèles d'IA.

Qu'est-ce que cela signifie pour l'industrie de l'IA ? D'abord, cela fournit un accès à un volume massif d'informations vérifiées et structurées, qui est essentiel pour entraîner des LLMs de qualité et fiables. Wikipedia contient des millions d'articles dans diverses langues, couvrant un large éventail de sujets – de l'histoire et de la science à la culture et à la technologie. L'utilisation de ces données aidera les modèles d'IA à mieux comprendre le monde et à générer des réponses plus pertinentes et précises. Deuxièmement, les accords de licence fournissent une source de financement durable pour la Fondation Wikimedia, permettant à l'organisation de continuer à maintenir et développer Wikipedia en tant que ressource mondiale de connaissances.

Cependant, cette étape comporte des risques potentiels. Il est important que l'utilisation du contenu de Wikipedia soit conforme aux principes de neutralité et d'objectivité qui sous-tendent l'encyclopédie. Il faut prévenir les situations où les modèles d'IA entraînés sur les données de Wikipedia propagent de la désinformation ou des opinions biaisées. La Fondation Wikimedia doit surveiller attentivement l'utilisation de son contenu et réagir rapidement à toute violation. De plus, il est important d'assurer la transparence quant aux données de Wikipedia utilisées pour entraîner divers modèles d'IA.

La conclusion d'accords de licence avec les entreprises d'IA est une étape importante pour Wikipedia et toute l'industrie de l'intelligence artificielle. Elle ouvre de nouvelles opportunités pour le développement de l'IA, mais nécessite une approche responsable et le respect des principes d'ouverture et de neutralité. À l'avenir, nous verrons probablement d'autres grandes sources de données suivre l'exemple de Wikipedia et commencer à monétiser leur contenu pour l'entraînement de l'IA. Cela pourrait conduire à la formation d'un nouveau marché de données pour l'IA, qui à son tour aurait un impact significatif sur le développement des technologies d'intelligence artificielle.

ZK
Hamidun News
Actualités IA sans bruit. Sélection éditoriale quotidienne de plus de 400 sources. Produit de Zhemal Khamidun, Head of AI chez Alpina Digital.

Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?

AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.

Qu'en pensez-vous ?
Chargement des commentaires…