36Kr (36氪)→ original

Les données comme carburant : la Chine crée un marché légal pour l'entraînement des réseaux neuronaux

L'ère où les développeurs d'intelligence artificielle aspiraient simplement internet à la recherche de textes et d'images touche à sa fin. Tous se sont…

Traité par IA depuis 36Kr (36氪) ; édité par Hamidun News
Les données comme carburant : la Chine crée un marché légal pour l'entraînement des réseaux neuronaux
Source : 36Kr (36氪). Collage: Hamidun News.
◐ Écouter l'article

L'ère où les développeurs d'intelligence artificielle aspiraient simplement internet à la recherche de textes et d'images touche à sa fin. Tous se sont heurtés à un "mur de données" : il y a moins de contenu de qualité dans le domaine public, et davantage de procès de la part des détenteurs de droits. Dans cette situation, la Chine a décidé de ne pas attendre la bénévolence du marché et s'est engagée dans le cadre du régime d'État.

Le Bureau national des données, avec le Ministère de l'Industrie et d'autres organismes, a publié un document qui crée effectivement une nouvelle industrie dans le pays — un marché légal du commerce d'informations. Au cœur de la nouvelle stratégie se trouvent trois types d'organisations qui doivent transformer des octets bruts en actifs précieux. Les premiers sont les bourses de données, des plates-formes officielles où les transactions se déroulent sous supervision réglementaire.

Les deuxièmes sont les plates-formes de services qui fournissent l'aspect technique, du stockage au calcul. Et sans doute les plus intéressants sont les "courtiers en données" ou fournisseurs de données. Ce sont des entreprises qui se consacreront professionnellement à la recherche, au nettoyage et à la structuration des informations pour les besoins spécifiques des clients.

Cela semble comme une profession d'un roman cyberpunk, mais pour la Chine c'est maintenant une réalité économique officielle. Pourquoi cela est-il nécessaire en ce moment ? La réponse réside dans le programme national "IA Plus".

Pékin comprend que la domination technologique dans le domaine des LLM et de la robotique est impossible sans d'énormes volumes de données spécifiques : médicales, industrielles, logistiques. La plupart de ces trésors sont actuellement enfermés dans des bases de données locales de ministères et de corporations. Créer des intermédiaires légaux est une manière "d'ouvrir les archives" et de donner aux développeurs de modèles un accès légal à celles-ci sans (en théorie) violer les lois de sécurité.

Après la création du Bureau national des données l'année dernière, beaucoup se demandaient où mènerait cette initiative. Maintenant la réponse est claire : la Chine construit une infrastructure où les données deviennent autant une marchandise que le lithium ou le pétrole. Si auparavant l'entraînement d'un réseau de neurones sur des données gouvernementales fermées était une zone grise, cela devient maintenant une entreprise encouragée par l'État.

Cela donne aux entreprises chinoises un avantage colossal — la capacité à entraîner des modèles sur des données réelles du secteur gouvernemental et industriel auxquelles des entreprises comme OpenAI n'auront jamais accès. Bien sûr, la question de la mise en œuvre demeure. Un marché de données est une substance capricieuse.

Comment évaluer une base de données de patients ou les journaux de fonctionnement d'une centrale électrique ? Comment garantir que les données ne s'échappent pas vers le marché noir ? Les autorités chinoises envisagent de résoudre cela par la certification stricte de ces "courtiers en données".

Effectivement, l'État crée un club fermé de fournisseurs de confiance qui deviendront un pont entre les propriétaires d'informations et les créateurs d'IA. C'est une tentative d'organiser le chaos et de transformer la "course à l'IA" en construction ordonnée de l'industrie. L'essentiel : Pékin parie sur la légalisation et la commercialisation des données.

Tandis que le reste du monde débat de l'éthique du scraping, la Chine construit des usines de traitement de l'information. Si la régulation d'État pourra créer un marché suffisamment flexible pour les besoins de l'IA — c'est la question principale pour l'année à venir.

ZK
Hamidun News
Actualités IA sans bruit. Sélection éditoriale quotidienne de plus de 400 sources. Produit de Zhemal Khamidun, Head of AI chez Alpina Digital.

Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?

AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.

Qu'en pensez-vous ?
Chargement des commentaires…