Hugging Face Blog→ original

Hugging Face : les modèles open-source chinois dépassent les États-Unis en téléchargements dans l’écosystème AI

Hugging Face a publié son bilan de printemps de l’AI open-source, et la conclusion principale est simple : l’écosystème est devenu grand public, et la Chine…

Traité par IA depuis Hugging Face Blog ; édité par Hamidun News
Hugging Face : les modèles open-source chinois dépassent les États-Unis en téléchargements dans l’écosystème AI
Source : Hugging Face Blog. Collage: Hamidun News.
◐ Écouter l'article

Hugging Face a publié son aperçu du printemps de l'état de l'IA open-source, et selon ces données, l'écosystème ouvert a déjà cessé d'être une niche pour les enthousiastes. Au cours de la dernière année, il a connu une croissance considérable en termes d'échelle, et le centre de gravité se déplace de plus en plus vers la Chine, les développeurs indépendants et les modèles plus pratiques qui sont réellement déployés en production.

L'écosystème est devenu grand public

Selon Hugging Face, d'ici 2025, la plateforme a atteint 13 millions d'utilisateurs, plus de 2 millions de modèles publics et plus de 500 mille ensembles de données ouverts. La quantité seule n'est pas le seul élément important. L'équipe note que les utilisateurs téléchargent de plus en plus non seulement des modèles prêts à l'emploi, mais créent également des artefacts dérivés : fine-tuning, adaptateurs, benchmarks et applications pratiques.

En d'autres termes, l'open source en IA n'est plus une bibliothèque de consultation mais un environnement d'assemblage actif et de réutilisation. Dans le même temps, l'écosystème est distribué très inégalement. Environ la moitié des modèles sur Hugging Face ont moins de 200 téléchargements au total, et près de 49,6% de tous les téléchargements proviennent uniquement des 200 modèles les plus populaires.

Cela montre clairement comment fonctionne le marché : au sommet, il y a quelques familles très remarquables, et en dessous se trouvent des milliers de projets étroits, locaux et appliqués.

  • 13 millions d'utilisateurs sur la plateforme
  • Plus de 2 millions de modèles publics
  • Plus de 500 mille ensembles de données publics
  • 49,6% des téléchargements proviennent des 200 modèles principaux
  • Environ la moitié des modèles ont moins de 200 téléchargements

La Chine et les développeurs indépendants

Le principal décalage géographique du rapport est que la Chine a déjà dépassé les États-Unis en termes de téléchargements mensuels et cumulatifs de modèles. Au cours de la dernière année, les modèles chinois ont représenté 41% de tous les téléchargements sur la plateforme. Le nombre de nouveaux dépôts et de versions de grandes entreprises a particulièrement augmenté : Baidu est passée de zéro version sur le Hub en 2024 à plus de 100 en 2025, tandis que ByteDance et Tencent ont multiplié leur activité par huit à neuf.

Suite au succès de DeepSeek R1, l'écosystème chinois a clairement misé sur les poids ouverts. Tout aussi important est un autre décalage : la part de l'industrie dans le développement global a baissé d'environ 70% à 37% en comparant la période antérieure à 2022 et 2025. Dans ce contexte, les développeurs indépendants et les petites équipes sont passés de 17% à 39% de tous les téléchargements, et dans certaines périodes ont même contribué à plus de la moitié de l'utilisation.

Ces acteurs font souvent la quantification, l'adaptation et le repackaging des modèles de base pour des scénarios réels. En effet, ils sont devenus une couche de distribution distincte entre les créateurs de modèles foundation et les utilisateurs finaux.

Les modèles accessibles gagnent

Le rapport souligne que la demande réelle se déplace de plus en plus des systèmes géants vers des modèles qui sont plus simples et moins coûteux à exécuter. Même en tenant compte du nombre de versions, les modèles de taille 1-9B sont téléchargés environ quatre fois plus fréquemment que les systèmes 100B+, ce qui est un écart beaucoup plus petit que celui qu'on pourrait attendre compte tenu de tout le bruit autour des modèles frontier. L'engagement moyen après le lancement se maintient autour de six semaines, donc sans mises à jour constantes, même les familles fortes perdent rapidement l'attention du marché.

En pratique, cela signifie que non seulement les modèles les plus puissants gagnent, mais aussi les plus commodes à développer. La famille Qwen d'Alibaba a déjà produit plus de 113 mille modèles dérivés, et si nous comptons tous les modèles avec l'étiquette Qwen, il en existe plus de 200 mille. En parallèle, de nouvelles sous-communautés se développent rapidement.

En robotique, le nombre d'ensembles de données est passé de 1 145 à 26 991 en un an, faisant de cette catégorie la plus grande sur la plateforme. Pour les tâches scientifiques, les modèles open-source sont de plus en plus utilisés pour travailler avec les protéines, les molécules et les données de recherche. Tout cela s'ajoute à un décalage vers du matériel moins coûteux, la quantification et l'exécution des modèles plus proche de l'infrastructure edge.

Ce que cela signifie

L'IA open-source entre dans une phase où la victoire est déterminée non seulement par la qualité du modèle de base, mais aussi par la vitesse d'adaptation, le nombre de builds dérivés et la commodité du déploiement local. Pour les entreprises, c'est un signal pour regarder non seulement vers les systèmes frontier fermés, mais aussi vers les écosystèmes ouverts autour de Qwen, DeepSeek, Gemma et autres familles, car c'est là que la valeur pratique émerge le plus rapidement en ce moment.

ZK
Hamidun News
Actualités IA sans bruit. Sélection éditoriale quotidienne de plus de 400 sources. Produit de Zhemal Khamidun, Head of AI chez Alpina Digital.

Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?

AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.

Qu'en pensez-vous ?
Chargement des commentaires…