OpenAI accuse DeepSeek d'utiliser des données de modèles américains pour entraîner R1
OpenAI a averti les autorités américaines d'une concurrence déloyale de la part de la startup chinoise DeepSeek. Selon un mémorandum interne, DeepSeek…
Traité par IA depuis Bloomberg Tech ; édité par Hamidun News
# OpenAI accuse DeepSeek de l'utilisation non autorisée de modèles américains
Les tensions dans la course mondiale de l'intelligence artificielle ont atteint un nouveau niveau. OpenAI a adressé un avertissement officiel aux législateurs américains indiquant que la startup chinoise DeepSeek emploie des méthodes sophistiquées et ingénieuses pour extraire des informations précieuses des principaux réseaux de neurones américains afin d'entraîner son chatbot révolutionnaire R1. Cet incident, rapporté par Bloomberg, révèle non seulement un conflit commercial, mais un affrontement fondamental sur la protection de la propriété intellectuelle et l'avantage concurrentiel à l'ère de l'intelligence artificielle.
Selon un mémorandum interne d'OpenAI, DeepSeek utilise une technique de distillation — un processus au cours duquel un modèle plus petit apprend des résultats d'un système plus grand et plus avancé. En pratique, cela signifie que les ingénieurs de DeepSeek soumettent systématiquement des requêtes aux modèles américains, analysent leurs réponses et utilisent les données obtenues pour entraîner leurs propres algorithmes. Cette approche permet à l'entreprise chinoise d'économiser d'énormes ressources de calcul et du temps de développement, généralement nécessaires pour créer des modèles de niveaux de performance comparables. En d'autres termes, selon OpenAI, DeepSeek parasite essentiellement les investissements des entreprises américaines en recherche et développement.
Le contexte de ce conflit est critique pour comprendre son ampleur. Développer des modèles de langage avancés nécessite des centaines de millions de dollars pour l'achat de puissance informatique, l'embauche de spécialistes de haut niveau et la conduite d'expériences. OpenAI, Microsoft et autres géants américains ont dépensé des milliards pour atteindre le niveau actuel de performance. DeepSeek, en revanche, a réussi à atteindre un niveau comparable en délais beaucoup plus courts et avec des coûts significativement inférieurs. Cela soulève des questions légitimes sur la question de savoir si ce succès a été obtenu honnêtement ou s'il résulte du « prêt » systématique de connaissances des modèles américains.
L'accusation d'OpenAI est importante également parce qu'elle attire l'attention sur la vulnérabilité des interfaces API. La plupart des modèles avancés sont disponibles via des services web, où les développeurs peuvent soumettre des requêtes et recevoir des réponses. Bien que les conditions d'utilisation interdisent d'utiliser les données de sortie pour entraîner des systèmes concurrents, cela est extrêmement difficile à suivre et à prévenir. DeepSeek a potentiellement simplement exécuté ce schéma à grande échelle, en traitant des millions de requêtes et en extrayant des informations structurées pour ses besoins.
L'incident met également en évidence le déséquilibre croissant dans la course technologique entre les États-Unis et la Chine. Les entreprises américaines font face à des restrictions strictes sur l'exportation de technologie avancée vers la Chine, mais elles ne peuvent pas bloquer complètement l'accès à leurs services publics sans nuire aux affaires mondiales. DeepSeek a apparemment trouvé une faille dans ce système. OpenAI demande maintenant une protection renforcée de la propriété intellectuelle et une surveillance plus rigoureuse de l'utilisation des API commerciales.
L'évolution future des événements dépend de la réaction des régulateurs américains et des mesures qu'ils prendront pour protéger les intérêts de l'industrie locale. À court terme, cela pourrait entraîner des conditions plus strictes pour accéder aux modèles avancés et la mise en œuvre de systèmes de vérification plus complexes. À long terme, le conflit souligne la nécessité de repenser les approches du partage de la propriété intellectuelle à l'ère des API ouvertes et de l'économie numérique mondiale. La question de savoir comment protéger l'innovation et l'investissement tout en restant ouvert au progrès scientifique reste l'une des plus pressantes de l'industrie.
Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?
AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.