Microsoft PCM: le géant de Redmond ouvre un supermarché de données pour l'entraînement de l'IA
Tu te souviens de ces beaux jours où Internet semblait être un buffet illimité et gratuit pour les développeurs d'IA ? Ces jours sont officiellement révolus…
Traité par IA depuis The Verge ; édité par Hamidun News
Tu te souviens de ces beaux jours où Internet semblait être un buffet illimité et gratuit pour les développeurs d'IA ? Ces jours sont officiellement révolus. Microsoft a décidé de diriger un processus que beaucoup dans l'industrie considéraient comme inévitable, et construit le Publisher Content Marketplace (PCM). En termes simples, c'est une sorte d'App Store, mais au lieu d'applications, on y vend des droits d'utilisation de textes, de nouvelles et d'analyses. Le géant de Redmond ne veut plus voir ses partenaires et concurrents se noyer dans des litiges sans fin contre des conglomérats médiatiques furieux.
Le contexte est ici plus important que la technologie elle-même. Au cours des deux dernières années, l'industrie de l'IA fonctionnait en mode "téléchargez d'abord, excusez-vous plus tard". OpenAI, Google et Microsoft elle-même absorbaient des pétaoctets de données du web ouvert sans demander la permission et encore moins offrir de l'argent.
Le résultat a été des procès de haut profil du New York Times et d'autres acteurs majeurs. Microsoft PCM est une tentative de légaliser le processus avant que les tribunaux ne ferment définitivement le robinet des données. Des poids lourds comme Vox Media, Associated Press et Condé Nast sont déjà impliqués dans le développement de la marketplace.
Ces entreprises en ont assez de combattre les bots de scraping et ont décidé que si leur contenu sera utilisé de toute façon, elles devraient au moins être payées pour cela.
Qu'est-ce qui a exactement changé dans l'approche ? Le mot clé ici est « grounding ». Les LLM modernes hallucinent souvent, et pour qu'ils produisent des faits actualisés, ils ont besoin d'accès à des sources fraîches et fiables. PCM permettra aux développeurs de se connecter directement aux archives médiatiques, en obtenant des informations vérifiées en temps réel. En même temps, les éditeurs conservent le contrôle : ils établissent eux-mêmes les conditions d'utilisation et voient des rapports détaillés. Microsoft promet la transparence qui faisait tant défaut dans les accords conclus entre OpenAI et les groupes médiatiques individuels.
Pourquoi cela importe-t-il pour le marché maintenant ? Microsoft crée essentiellement une infrastructure pour une nouvelle économie de la connaissance. Si les données étaient autrefois le « nouvel or noir » que chacun pouvait extraire gratuitement sur la terre d'autrui, Microsoft place maintenant une clôture autour de cette terre et ouvre la caisse. C'est une excellente nouvelle pour les grands éditeurs dont les archives valent des millions, mais un signal d'alarme pour les petites startups d'IA. Seuls les géants pourront se permettre le contenu sous licence, ce qui élargira encore l'écart entre Big Tech et tous les autres. Nous assistons à la transformation progressive d'Internet ouvert en un jardin clos où les bots doivent payer pour entrer.
Il faut reconnaître que Microsoft a choisi le moment idéal. L'entreprise doit protéger son Copilot contre les risques juridiques, et PCM résout cette tâche élégamment. Au lieu de négocier avec chaque éditeur individuellement, ils créent une norme. Si PCM devient une norme de l'industrie, Microsoft obtiendra le contrôle non seulement sur les ressources informatiques et les modèles, mais aussi sur la matière première sur laquelle ces modèles fonctionnent. C'est un mouvement stratégique qui consolide la domination de l'entreprise dans la chaîne alimentaire de l'IA pour les années à venir.
L'essentiel : Microsoft transforme l'octroi de licences de données en un modèle commercial évolutif, reconnaissant efficacement que l'ère du scraping web gratuit est terminée. Êtes-vous prêt pour que l'entraînement des réseaux de neurones devienne un privilège des riches ?
Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?
AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.