Qwen 2.5-Max: Alibaba alcançou Google enquanto você dormia
O mundo da IA se acostumou com o duopólio OpenAI e Google, mas engenheiros chineses da Alibaba Cloud decidiram que era hora de mudar as regras do jogo. Sem…
Processado por IA de Jiqizhixin (机器之心); editado por Hamidun News
O mundo da IA se acostumou com o duopólio OpenAI e Google, mas engenheiros chineses da Alibaba Cloud decidiram que era hora de mudar as regras do jogo. Sem alarde e apresentações grandiosas, a empresa lançou seu modelo mais poderoso — Qwen 2.5-Max.
Se confiar nos benchmarks mais recentes, temos um concorrente de verdade para Gemini 1.5 Pro e GPT-4o, que não é apenas "bom para a China", mas objetivamente forte em escala global. Os desenvolvedores miram a liderança nas disciplinas mais desafiadoras: matemática, escrita de código e raciocínio lógico.
Para entender a escala do evento, vale observar o contexto. A linha Qwen foi considerada por muito tempo um sólido meio-de-tabela, que se saía muito bem em tarefas locais, mas perdia para os modelos principais do Vale. Tudo mudou com o lançamento da versão 2.
5. Alibaba aplicou a arquitetura Mixture-of-Experts (MoE), que permite que o modelo seja simultaneamente vasto em conhecimento e eficiente em computação. Nos testes MMLU e HumanEval, a nova Qwen 2.
5-Max mostra resultados que fazem engenheiros em Mountain View verificar nervosamente seus gráficos. O progresso em programação é particularmente impressionante: o modelo resolve tarefas arquiteturais que antes estavam ao alcance apenas das versões top do Claude. O gigante chinês não simplesmente copiou desenvolvimento ocidental, mas otimizou para desafios comerciais reais.
Qwen 2.5-Max suporta uma janela de contexto que permite analisar bibliotecas inteiras de código ou enormes relatórios financeiros. Enquanto isso, Alibaba mantém uma política de preços agressiva.
O acesso à API custa muito menos que dos concorrentes, tornando o modelo extremamente atraente para startups e grandes corporações que sabem contar dinheiro. Este é o movimento clássico Alibaba: pegar a tecnologia, torná-la em massa e despencar os preços. É interessante ver com que rapidez Qwen se adapta às nuances linguísticas complexas.
Se modelos chineses costumavam "alucinar" frequentemente ao tentar raciocinar sobre tópicos fora de seu conjunto de treinamento, o 2.5-Max demonstra estabilidade surpreendente. Escreve poesia em mandarim tão confiante quanto faz debug de scripts Python.
Isso coloca o Google em posição incômoda: seu Gemini 1.5 Pro foi considerado por muito tempo o padrão em multimodalidade e lógica, mas agora um jogador está pisando nos seus calcanhares — um que não tem problemas para acessar capacidade de produção e enormes massivos de dados. O que isso significa para a indústria como um todo?
Estamos entrando em uma fase onde a vantagem tecnológica deixa de ser exclusiva de um país. Enquanto nos EUA debatem regulações e desaceleração no treinamento de novos modelos, em Hangzhou simplesmente escalam a pilha. Qwen 2.
5-Max prova que modelos abertos e semi-abertos (open-weights) se desenvolvem mais rápido que ecossistemas fechados. Se amanhã Alibaba decidir lançar os pesos deste modelo para acesso aberto, isso poderia remodelar completamente a paisagem de desenvolvimento de aplicações IA em todo o mundo. A pergunta chave: O Google conseguirá manter sua liderança com o lançamento completo do Gemini 2.
0, ou os modelos chineses agora definirão o ritmo para toda a indústria?
Quer parar de ler sobre IA e começar a usar?
AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.