Hugging Face Blog→ original

Hugging Face: los modelos open-source chinos superan a EE. UU. en descargas dentro del ecosistema de AI

Hugging Face publicó su panorama de primavera del AI open-source, y la conclusión principal es simple: el ecosistema se volvió masivo y China pasó a liderar…

Procesado por IA desde Hugging Face Blog; editado por Hamidun News
Hugging Face: los modelos open-source chinos superan a EE. UU. en descargas dentro del ecosistema de AI
Fuente: Hugging Face Blog. Collage: Hamidun News.
◐ Escuchar artículo

Hugging Face ha publicado su revisión de primavera del estado de la IA open-source, y según estos datos, el ecosistema abierto ya ha dejado de ser un nicho para entusiastas. Durante el último año ha crecido considerablemente en escala, y el centro de gravedad se está desplazando cada vez más hacia China, desarrolladores independientes y modelos más prácticos que se implementan realmente en producción.

El ecosistema se ha vuelto masivo

Según Hugging Face, para 2025 la plataforma ha crecido a 13 millones de usuarios, más de 2 millones de modelos públicos y más de 500 mil datasets abiertos. No solo es importante la cantidad. El equipo señala que cada vez más usuarios no solo descargan modelos listos, sino que lanzan artefatos derivados sobre ellos: fine-tuning, adaptadores, benchmarks y aplicaciones prácticas.

Es decir, el open source en IA ha dejado de ser una biblioteca para consulta y se ha convertido en un entorno de ensamblaje activo y reutilización. Al mismo tiempo, el ecosistema está distribuido de manera muy desigual. Aproximadamente la mitad de los modelos en Hugging Face tienen menos de 200 descargas en total, y casi el 49,6% de todas las descargas provienen de apenas los 200 modelos más populares.

Esto muestra claramente cómo funciona el mercado: en la cima hay algunas pocas familias muy destacadas, y debajo hay miles de proyectos estrechos, locales y aplicados.

  • 13 millones de usuarios en la plataforma
  • Más de 2 millones de modelos públicos
  • Más de 500 mil datasets públicos
  • El 49,6% de las descargas provienen de los 200 modelos principales
  • Aproximadamente la mitad de los modelos tienen menos de 200 descargas

China y desarrolladores independientes

El principal desplazamiento geográfico en el informe es que China ya ha superado a Estados Unidos tanto en descargas mensuales como acumulativas de modelos. Durante el último año, los modelos chinos representaron el 41% de todas las descargas en la plataforma. El número de nuevos repositorios y lanzamientos de grandes empresas ha crecido especialmente rápido: Baidu pasó de cero lanzamientos en el Hub en 2024 a más de 100 en 2025, mientras que ByteDance y Tencent aumentaron su actividad ocho a nueve veces.

Tras el éxito de DeepSeek R1, el ecosistema chino claramente ha apostado por pesos abiertos. Igualmente importante es otro desplazamiento: la participación de la industria en el desarrollo general cayó de aproximadamente el 70% al 37% cuando se compara el período anterior a 2022 con 2025. En este contexto, desarrolladores independientes y pequeños colectivos crecieron del 17% al 39% de todas las descargas, e incluso en ciertos períodos contribuyeron más de la mitad del uso.

Estos actores a menudo hacen cuantización, adaptación y reempaquetamiento de modelos base para escenarios reales. Efectivamente, se han convertido en una capa de distribución separada entre creadores de modelos foundation y usuarios finales.

Los modelos accesibles están ganando

El informe enfatiza que la demanda real se está desplazando cada vez más desde sistemas gigantescos hacia modelos que son más simples y baratos de ejecutar. Incluso teniendo en cuenta el número de lanzamientos, los modelos de tamaño 1-9B se descargan aproximadamente solo cuatro veces más frecuentemente que sistemas de 100B+, lo que es una brecha mucho menor de la que se podría esperar dada toda la atención en torno a los modelos frontier. El compromiso promedio después del lanzamiento se mantiene alrededor de seis semanas, por lo que sin actualizaciones constantes incluso las familias fuertes pierden rápidamente la atención del mercado.

En la práctica, esto significa que ganan no solo los modelos más poderosos sino también los más convenientes para refactorización. La familia Qwen de Alibaba ya ha producido más de 113 mil modelos derivados, y si contamos todos los modelos con la etiqueta Qwen, hay más de 200 mil. En paralelo, nuevas subcomunidades están creciendo rápidamente.

En robótica, el número de datasets creció de 1.145 a 26.991 en un año, convirtiendo la categoría en la más grande de la plataforma.

En tareas científicas, los modelos open-source se están aplicando cada vez más para trabajar con proteínas, moléculas y datos de investigación. Todo esto se complementa con un desplazamiento hacia hardware más barato, cuantización y ejecución de modelos más cerca de la infraestructura edge.

Qué significa esto

La IA open-source está entrando en una fase donde la victoria está determinada no solo por la calidad del modelo base sino también por la velocidad de adaptación, el número de compilaciones derivadas y la conveniencia de la ejecución local. Para las empresas, esto es una señal para mirar no solo hacia sistemas frontier cerrados sino también hacia ecosistemas abiertos alrededor de Qwen, DeepSeek, Gemma y otras familias, porque es ahí donde el valor práctico está surgiendo más rápido en este momento.

ZK
Hamidun News
Noticias de AI sin ruido. Selección editorial diaria de más de 400 fuentes. Producto de Zhemal Khamidun, Head of AI en Alpina Digital.

¿Quieres dejar de leer sobre IA y empezar a usarla?

AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.

¿Qué te parece?
Cargando comentarios…