ChatGPT cite Grokipedia : OpenAI a trouvé une nouvelle source de vérité
Le monde de l'intelligence artificielle est petit, mais nous ne nous attendions pas à ce qu'il devienne si petit si rapidement. Les utilisateurs de ChatGPT…
Traité par IA depuis TechCrunch ; édité par Hamidun News
Le monde de l'intelligence artificielle est petit, mais nous ne nous attendions pas à ce qu'il devienne si petit si rapidement. Les utilisateurs de ChatGPT ont découvert quelque chose d'étrange : le réseau de neurones a commencé à extraire des données de Grokipedia. Si vous avez manqué ce lancement, Grokipedia est un projet ambitieux de xAI d'Elon Musk, qui se positionne comme une base de connaissances sans censure et sans agenda de gauche. L'ironie de la situation est hors normes : l'entreprise de Sam Altman, que Musk accuse régulièrement de progressisme excessif et de fermeture, s'appuie maintenant sur sa propre création pour façonner ses réponses.
Pour comprendre comment nous en sommes arrivés là, nous devons nous souvenir de l'historique du conflit. Musk était à l'origine d'OpenAI, puis il est parti en claquant la porte, et a lancé son propre xAI avec un agenda anti-woke. Grokipedia est devenue sa réponse à Wikipedia, qu'Elon considère comme trop biaisée. C'est un énorme ensemble de données généré et modéré par les algorithmes de xAI. Et maintenant ces données apparaissent dans ChatGPT. Pourquoi cela se produit-il maintenant ? La réponse est simple et en même temps préoccupante : OpenAI a désespérément besoin de données fraîches, et l'entreprise n'est pas trop pointilleuse sur les méthodes pour les obtenir.
Les web crawlers d'OpenAI parcourent Internet en permanence. Lorsque xAI a lancé Grokipedia en accès public, elle est devenue automatiquement une partie du domaine public pour les bots de recherche. Il semble que les ingénieurs d'Altman n'aient pas mis de filtre sur les domaines de Musk, ou que les algorithmes de classement aient jugé le contenu de Grokipedia suffisamment pertinent. En résultat, nous avons obtenu un cocktail amusant. ChatGPT, qui essaie habituellement d'éviter les sujets controversés, produit soudainement des faits ou des interprétations caractéristiques de Grok. Ce n'est pas juste une curiosité technique ; c'est un signe d'une crise de données imminente dans toute l'industrie.
Nous nous sommes rapprochés du moment où le contenu humain de qualité sur le web s'épuise tout simplement. Les développeurs de grands modèles de langage commencent à consommer du contenu créé par d'autres modèles. Dans les cercles professionnels, cela s'appelle la dégradation du modèle ou l'inceste numérique. Si ChatGPT apprend des données de Grokipedia, et que Grok continue d'apprendre des réponses de ChatGPT, nous risquons de créer une chambre d'écho fermée. Dans un tel système, les erreurs et les biais se multiplieront en progression géométrique, éloignant progressivement l'IA de la réalité.
Pour Elon Musk, cette situation ressemble à une victoire double. D'une part, sa base de connaissances est reconnue comme suffisamment importante pour être citée par le leader du marché. D'autre part, OpenAI utilise gratuitement la ressource de xAI, dans laquelle xAI a dépensé des millions de dollars et une énorme puissance de calcul. Cela nous rappelle les situations avec Reddit et Twitter, qui ont fermé leurs API pour que les géants de l'IA ne volent pas leur contenu pour l'entraînement. Il est très probable que le prochain mouvement de Musk sera de fermer Grokipedia aux bots d'OpenAI ou un autre procès retentissant pour violation de propriété intellectuelle.
Le problème du partage de données entre réseaux de neurones soulève une question éthique importante pour nous. Si l'IA commence à citer une autre IA sans lien direct vers la source originale, comment pourrons-nous vérifier l'exactitude des informations ? Pour l'instant, nous observons comment deux grands concurrents de l'industrie fusionnent involontairement dans un champ informationnel unique. Cela pourrait conduire soit à la création d'une superintelligence universelle, soit à un effondrement complet du sens, où un réseau de neurones récite simplement les hallucinations d'un autre.
L'essentiel : ce cas deviendra-t-il une raison pour une nouvelle guerre des droits d'auteur entre Musk et Altman, ou sommes-nous officiellement entrés dans une ère où l'IA s'entraîne mutuellement jusqu'à perdre tout lien avec la source originale humaine ?
Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?
AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.