3DNews AI→ original

GPT-5.2 et Grokipedia : pourquoi OpenAI cite Elon Musk

Imaginez que vous ayez passé des années à construire la plus parfaite bibliothèque du monde, en embauchant des milliers de curateurs et en annonçant une…

Traité par IA depuis 3DNews AI ; édité par Hamidun News
GPT-5.2 et Grokipedia : pourquoi OpenAI cite Elon Musk
Source : 3DNews AI. Collage: Hamidun News.
◐ Écouter l'article

Imaginez que vous ayez passé des années à construire la plus parfaite bibliothèque du monde, en embauchant des milliers de curateurs et en annonçant une qualité de connaissance sans précédent. Puis il s'avère que vos employés ont secrètement réécrit des articles la nuit en provenance d'un tabloïd douteux appartenant à votre plus féroce concurrent. C'est à peu près ce qui se passe avec OpenAI en ce moment.

Des journalistes du The Guardian ont mené une série de tests et découvert que le GPT-5.2 phare, lorsqu'il répond à des questions sociales et politiques délicates, reproduit soupçonnement avec précision les formulations et les erreurs factuelles de Grokipedia. Pour ceux qui auraient raté : Grokipedia est un projet de xAI d'Elon Musk, une base de connaissances générée par le réseau de neurones Grok, qui est célèbre pour son approche spécifique des faits et l'absence de filtres rigoureux.

La situation semble maximalement ironique si vous vous souvenez de l'historique de la relation entre Altman et Musk. Tandis qu'Elon poursuit OpenAI pour avoir trahi les idéaux du code ouvert, le réseau de neurones d'Altman consomme tranquillement du contenu créé par le réseau de neurones de Musk. Ce n'est pas simplement un incident amusant, mais un symptôme grave de la maladie de toute l'industrie.

Nous nous sommes heurtés à un problème que les chercheurs avaient prédit il y a quelques années — l'"effondrement des modèles." Quand l'espace Internet se remplit de texte généré, les nouveaux modèles commencent inévitablement à apprendre des sous-produits de leurs prédécesseurs. Dans ce cas, GPT-5.

2 a probablement avalé Grokipedia lors d'un autre crawl à grande échelle du réseau, ne parvenant pas à distinguer les hallucinations de Grok des informations vérifiées.

Pourquoi cela s'est-il produit maintenant ? OpenAI s'est toujours enorgueillie de ses méthodes de nettoyage des données et du RLHF (apprentissage par renforcement à partir des retours humains). Cependant, le volume de données nécessaires pour entraîner des modèles au niveau de GPT-5.2 est tellement énorme que la modération manuelle devient physiquement impossible. Les algorithmes de filtrage ont apparemment considéré Grokipedia comme une ressource structurée et utile. En résultat, nous obtenons une boucle fermée : un réseau de neurones fait une erreur, un deuxième élève cette erreur au rang de vérité, et l'utilisateur obtient une "hallucination au carré." Cela mine le concept de l'IA comme source objective d'information.

L'analyse du Guardian montre que GPT-5.2 ne fait pas seulement emprunter des faits, mais adopte également le ton spécifique de Grokipedia. Dans certains cas, le modèle d'OpenAI a commencé à utiliser des arguments qui étaient auparavant considérés comme inacceptables dans sa politique de sécurité interne. Cela signifie que les données "poubelles" peuvent percer même les barrières éthiques soigneusement construites. Si un modèle voit la même thèse dans mille articles générés, il commence à la considérer comme une norme statistique. Pour OpenAI, cela signifie le besoin urgent de repenser ses pipelines de préparation de données, sinon la prochaine itération du modèle risque de devenir une chambre d'écho pour les délires d'autrui.

Que signifie cela pour nous ? L'époque où nous pouvions faire confiance aux résultats de recherche ou aux réponses des réseaux de neurones comme connaissance "humaine" est définitivement révolue. Si même les leaders du marché ne peuvent pas filtrer le bruit des réseaux de neurones des concurrents, alors le problème de la pollution d'Internet devient critique. Nous entrons dans une phase où la valeur principale proviendra non pas des algorithmes de traitement, mais de l'accès à des données "propres," garanties humaines. La seule question est s'il en reste suffisamment pour entraîner les futurs systèmes, ou sommes-nous condamnés à mâcher interminablement la malbouffe numérique préparée par Grok et ses collègues.

L'essentiel : OpenAI peut-elle prouver que son modèle n'est pas simplement un agrégateur d'hallucinations d'autrui, ou l'ère des données de qualité a-t-elle définitivement pris fin ?

ZK
Hamidun News
Actualités IA sans bruit. Sélection éditoriale quotidienne de plus de 400 sources. Produit de Zhemal Khamidun, Head of AI chez Alpina Digital.

Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?

AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.

Qu'en pensez-vous ?
Chargement des commentaires…