Wired→ original

Musk a reconnu sous serment : xAI a utilisé des modèles d’OpenAI pour la distillation lors de la création de ses systèmes

Sous serment, Elon Musk a de fait confirmé que xAI avait utilisé des modèles d’OpenAI pour entraîner ses propres systèmes via la technique de distillation…

Traité par IA depuis Wired ; édité par Hamidun News
Musk a reconnu sous serment : xAI a utilisé des modèles d’OpenAI pour la distillation lors de la création de ses systèmes
Source : Wired. Collage: Hamidun News.
◐ Écouter l'article

Elon Musk, lors de sa déposition sous serment, a effectivement confirmé que xAI a utilisé les modèles d'OpenAI pour la distillation lors de l'entraînement de ses propres systèmes. Lorsqu'il a été interrogé par les avocats, il n'a pas nié l'utilisation de modèles concurrents et a déclaré que c'est une pratique standard dans l'ensemble de l'industrie de l'IA.

Ce qui s'est passé lors de la déposition

Musk a témoigné dans le cadre de procédures judiciaires liées à son conflit continu avec OpenAI. Le témoignage a été rendu public par les procédures judiciaires : selon la transcription, les avocats ont directement demandé si xAI avait utilisé les données de sortie des modèles d'OpenAI lors de l'entraînement de Grok. Musk a effectivement confirmé cela, citant les normes de l'industrie.

La distillation est une technique d'entraînement de réseaux de neurones dans laquelle un modèle apprend à reproduire le comportement d'un autre modèle plus grand. Cela permet de créer des systèmes compacts et efficaces sans énormes coûts de calcul. La technique est répandue dans l'industrie, mais son application dans ce cas soulève de sérieuses questions juridiques. Les conditions d'utilisation d'OpenAI interdisent explicitement d'utiliser les données de sortie de ses modèles pour entraîner des systèmes d'IA concurrents. Si xAI a violé cette disposition, nous ne parlons plus de normes de l'industrie, mais d'une potentielle rupture de contrat.

L'argument « tout le monde le fait »

Musk a construit sa défense autour de la thèse selon laquelle ces pratiques sont généralisées. C'est partiellement vrai : les limites autour des données d'entraînement de l'IA restent floues, et de nombreuses entreprises utilisent des données générées synthétiquement ou la distillation à partir d'autres modèles.

  • OpenAI aurait utilisé des données de YouTube lors de l'entraînement de GPT-4, contrairement aux conditions de la plateforme
  • Meta a lancé Llama, dont l'ensemble de données contenait des textes générés par ChatGPT ; l'entreprise les a ensuite supprimés à la demande d'OpenAI
  • Plusieurs startups d'IA chinois ont été accusés de distiller les modèles d'OpenAI pour créer des alternatives bon marché
  • Les données synthétiques d'un modèle sont devenues des matières premières pour l'entraînement d'autres — et cela est rarement divulgué publiquement

Néanmoins, le témoignage sous serment signifie une chose : Musk lui-même a documenté le fait pour le tribunal. Maintenant, OpenAI peut utiliser son témoignage à son avantage.

Le conflit entre Musk et OpenAI

Musk est l'un des fondateurs d'OpenAI, ayant investi environ 50 millions de dollars dans l'entreprise à ses débuts. En 2018, il a quitté le conseil d'administration, citant un conflit d'intérêts avec Tesla. Après cela, il a systématiquement attaqué l'entreprise publiquement et en 2024 l'a poursuivie en justice — l'accusant d'avoir abandonné sa mission originale à but non lucratif. Parallèlement aux poursuites judiciaires, Musk a fondé xAI et lancé Grok — un chatbot concurrent disponible pour les utilisateurs de la plateforme X. Dans ce contexte, l'admission que Grok aurait pu être entraîné sur les données d'OpenAI le place dans une position inconfortable : l'entreprise qu'il attaque devant les tribunaux s'est avérée être une partie de sa propre pile technologique.

« C'est une pratique standard pour les laboratoires d'IA », a déclaré

Musk lors de sa déposition.

Ce que cela signifie

L'histoire soulève une question qui couve depuis longtemps dans l'industrie de l'IA : les conditions d'utilisation des modèles sont-elles légalement contraignantes si leur violation est effectivement invérifiable ? Si le tribunal reconnaît la distillation des modèles concurrents comme une rupture de contrat, le précédent affectera l'ensemble de l'industrie — des grands laboratoires aux startups construisant des produits sur les API d'autrui.

ZK
Hamidun News
Actualités IA sans bruit. Sélection éditoriale quotidienne de plus de 400 sources. Produit de Zhemal Khamidun, Head of AI chez Alpina Digital.

Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?

AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.

Qu'en pensez-vous ?
Chargement des commentaires…