Hugging Face: modelos open-source chineses superam os EUA em downloads no ecossistema de AI
A Hugging Face divulgou seu panorama de primavera do AI open-source, e a principal conclusão é simples: o ecossistema se tornou mainstream, e a China assumiu…
Processado por IA de Hugging Face Blog; editado por Hamidun News
A Hugging Face publicou seu relatório de primavera sobre o estado da IA open-source, e segundo esses dados, o ecossistema aberto já deixou de ser um nicho para entusiastas. Ao longo do último ano, ele cresceu significativamente em escala, e o centro de gravidade está se deslocando cada vez mais para a China, desenvolvedores independentes e modelos mais práticos que são realmente implementados em produção.
O ecossistema se tornou em massa
De acordo com a Hugging Face, até 2025 a plataforma cresceu para 13 milhões de usuários, mais de 2 milhões de modelos públicos e mais de 500 mil datasets abertos. Não é apenas a quantidade que importa. O time escreve que os usuários cada vez mais não apenas baixam modelos prontos, mas lançam artefatos derivados acima deles: fine-tuning, adaptadores, benchmarks e aplicações práticas.
Ou seja, open source em IA deixou de ser uma biblioteca para consulta e se tornou um ambiente de montagem ativa e reuso. Ao mesmo tempo, o ecossistema está distribuído de forma muito desigual. Aproximadamente metade dos modelos na Hugging Face tem menos de 200 downloads no total de tempo, e quase 49,6% de todos os downloads vêm apenas dos 200 modelos mais populares.
Isso mostra bem como funciona o mercado: no topo existem algumas poucas famílias muito notáveis, e abaixo delas estão milhares de projetos estreitos, locais e aplicados.
- 13 milhões de usuários na plataforma
- Mais de 2 milhões de modelos públicos
- Mais de 500 mil datasets públicos
- 49,6% dos downloads vêm dos 200 modelos principais
- Aproximadamente metade dos modelos tem menos de 200 downloads
China e desenvolvedores independentes
O principal deslocamento geográfico no relatório é que a China já ultrapassou os EUA tanto em downloads mensais quanto cumulativos de modelos. Ao longo do último ano, modelos chineses receberam 41% de todos os downloads na plataforma. O número de novos repositórios e lançamentos de grandes empresas cresceu especialmente rápido: Baidu passou de zero lançamentos no Hub em 2024 para mais de 100 em 2025, enquanto ByteDance e Tencent aumentaram sua atividade oito a nove vezes.
Após o sucesso do DeepSeek R1, o ecossistema chinês claramente apostou em pesos abertos. Igualmente importante é outro deslocamento: a participação da indústria no desenvolvimento geral caiu de aproximadamente 70% para 37%, ao comparar o período anterior a 2022 e 2025. Neste contexto, desenvolvedores independentes e pequenos coletivos cresceram de 17% para 39% de todos os downloads, e em certos períodos até contribuíram com mais da metade do uso.
Esses players frequentemente fazem quantização, adaptação e reempacotamento de modelos básicos para cenários reais. Efetivamente, se tornaram uma camada de distribuição separada entre criadores de modelos foundation e usuários finais.
Modelos acessíveis estão vencendo
O relatório enfatiza que a demanda real está cada vez mais se deslocando de sistemas gigantescos para modelos que são mais simples e baratos de executar. Mesmo levando em conta o número de lançamentos, modelos de tamanho 1-9B são baixados apenas aproximadamente quatro vezes mais frequentemente do que sistemas de 100B+, o que é um hiato muito menor do que se poderia esperar pelo burburinho em torno de modelos frontier. O engajamento médio após o lançamento fica em torno de seis semanas, então sem atualizações constantes até famílias fortes perdem atenção rapidamente do mercado.
Na prática, isso significa que vêm aqueles que não são apenas os modelos mais poderosos, mas também os mais convenientes para refatoração. A família Qwen do Alibaba já produziu mais de 113 mil modelos derivados, e se contarmos todos os modelos com tag Qwen, há mais de 200 mil. Em paralelo, novas subcomunidades estão crescendo rapidamente.
Em robótica, o número de datasets cresceu de 1.145 para 26.991 em um ano, tornando a categoria a maior na plataforma.
Em tarefas científicas, modelos open-source estão sendo cada vez mais aplicados para trabalhar com proteínas, moléculas e dados de pesquisa. Tudo isso é complementado por um deslocamento para hardware mais barato, quantização e execução de modelos mais próximo à infraestrutura edge.
O que isso significa
IA open-source está entrando em uma fase onde a vitória é determinada não apenas pela qualidade do modelo base, mas também pela velocidade de adaptação, número de builds derivados e conveniência de execução local. Para empresas, isso é um sinal para olhar não apenas para sistemas frontier fechados, mas também para ecossistemas abertos ao redor de Qwen, DeepSeek, Gemma e outras famílias, porque é ali que valor prático está surgindo mais rapidamente neste momento.
Quer parar de ler sobre IA e começar a usar?
AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.