Alibaba lançou o Qwen 3.5 Small — modelos compactos para rodar diretamente nos dispositivos

Q: Qual é a fonte?

Publicado originalmente em MarkTechPost. O Hamidun News processa e adapta os materiais com IA.

Q: Quando foi publicado?

3 de mar. de 2026. Tempo de leitura: 3 min.

A equipe Qwen, da Alibaba, apresentou a série de modelos de linguagem compactos Qwen 3.5 Small, de 0,8 a 9 bilhões de parâmetros. Em vez de aumentar o…

Redação da Hamidun News

Monitoramento de AI · MarkTechPost

3 de mar. de 2026· 3 min

Processado por IA de MarkTechPost; editado por Hamidun News

Alibaba lançou o Qwen 3.5 Small — modelos compactos para rodar diretamente nos dispositivos — Fonte: MarkTechPost. Colagem: Hamidun News.

◐ Ouvir artigo

A indústria de inteligência artificial viveu nos últimos dois anos por uma fórmula simples: quanto mais parâmetros, mais inteligente é o modelo. Alibaba acabou de propor um cenário alternativo. O time Qwen lançou uma série de modelos de linguagem compactos chamados Qwen 3.5 Small — uma família que varia de 0,8 a 9 bilhões de parâmetros, projetada especificamente para funcionar em dispositivos do usuário sem recorrer a servidores em nuvem.

Para entender a significância deste lançamento, vale a pena olhar para o contexto. Nos últimos ano e meio, os principais laboratórios do mundo — OpenAI, Google, Anthropic — competem na criação de modelos "fronteira" cada vez maiores, com centenas de bilhões e até trilhões de parâmetros. Esses modelos demonstram resultados impressionantes, mas têm uma limitação fundamental: exigem a infraestrutura de servidor mais potente e funcionam exclusivamente através da nuvem. Cada solicitação do usuário viaja para um data center remoto e volta, criando latência, dependência de internet e questões de privacidade de dados. Alibaba decidiu atacar precisamente este problema.

A filosofia do Qwen 3.5 Small é formulada de forma sucinta: "More Intelligence, Less Compute" — mais inteligência com menores custos computacionais. Por trás deste slogan de marketing está um sério trabalho de engenharia. Os modelos da família cobrem uma faixa de 0,8 bilhão de parâmetros, permitindo executá-los até em smartphones orçamentários, até 9 bilhões — um tamanho confortável para laptops modernos e tablets com RAM suficiente. A questão-chave, para a qual ainda não há resposta abrangente dos benchmarks abertos, é o quão "inteligentes" esses modelos realmente são em comparação com concorrentes de tamanho similar. Entretanto, gerações anteriores de Qwen consistentemente mostraram resultados competitivos, e não há razão para acreditar que a nova série será uma exceção.

É importante entender que Alibaba não é pioneira aqui, mas talvez o jogador mais ambicioso. Microsoft já lançou a série Phi, Google — Gemma, Meta está desenvolvendo versões compactas de Llama. Entretanto, Qwen 3.

5 Small se destaca pela amplitude da sua linha: oferecer uma família inteira de modelos de diferentes tamanhos sob uma arquitetura única significa dar aos desenvolvedores flexibilidade de escolha. O criador de um aplicativo móvel de anotações pode pegar a versão de 0,8 bilhão de parâmetros para autocorreção básica, enquanto um fabricante de alto-falantes inteligentes pode usar o modelo de 4 bilhões de parâmetros para um assistente de voz completo. O modelo de 9 bilhões de parâmetros é capaz de lidar com tarefas que há um ano atrás exigiam chamar uma API em nuvem.

Para Alibaba, este lançamento também tem dimensões estratégicas. O gigante tecnológico chinês está lutando pela influência global na esfera de infraestrutura de IA. Modelos abertos são uma das principais ferramentas nesta luta. Todo desenvolvedor que integra Qwen em seu aplicativo se torna parte do ecossistema Alibaba. Dadas as sanções americanas que limitam o acesso de empresas chinesas a chips de ponta para treinar modelos gigantes, o foco em modelos compactos eficientes parece não apenas uma escolha tecnológica, mas também uma estratégia forçada e simultaneamente perspicaz. Se você não consegue o melhor hardware para treinar monstros de trilhões de parâmetros, faz sentido aprender a extrair o máximo de modelos menores.

As consequências para a indústria podem ser significativas. Modelos funcionando em dispositivos resolvem vários problemas dolorosos de uma vez. Privacidade: dados do usuário nunca saem do seu telefone. Velocidade: sem atraso de requisições de rede. Acessibilidade: IA funciona sem conexão com a internet. Custo: desenvolvedores não precisam pagar por cada chamada de API. Para bilhões de usuários em países em desenvolvimento, onde a internet móvel é instável e cara, IA local em um smartphone não é um luxo, mas o único caminho real para a tecnologia.

Claro, modelos compactos não vão substituir modelos de fronteira. Tarefas complexas de raciocínio, geração de texto longo e coerente, análise multimodal — tudo isso permanece território dos modelos grandes. Mas a grande maioria das tarefas cotidianas — sumarização, tradução, autocompletar, classificação, diálogo simples — está bem ao alcance de modelos com vários bilhões de parâmetros. E são essas tarefas que definem a experiência do usuário para centenas de milhões de pessoas.

O lançamento do Qwen 3.5 Small confirma uma tendência que definirá a indústria de IA nos próximos anos: o futuro da inteligência artificial não está apenas na nuvem. Está no bolso de cada usuário, em cada dispositivo capaz de executar inferência localmente. Alibaba fez sua aposta, e agora a bola está no lado dos concorrentes.

Hamidun News

Notícias de AI sem ruído. Seleção editorial diária de mais de 400 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.

Canal do Telegram RSS hamidun.com

Quer parar de ler sobre IA e começar a usar?

AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.

🎓 Academy — 7 dias grátis Consultoria grátis