Mistral AI apresenta Mistral 3: nova série de modelos com Mistral Large 3
Mistral AI lançou a série Mistral 3 — desde os compactos Ministral (3B, 8B, 14B) para uso local em laptops, robôs e dispositivos IoT até o poderoso Mistral…
Processado por IA de Mistral AI News; editado por Hamidun News
Mistral AI apresentou a Mistral 3 — uma nova série de modelos de linguagem abertos de diferentes tamanhos. A família inclui os compactos Ministral 3 (3B, 8B, 14B) para uso local e o poderoso Mistral Large 3 (675B parâmetros) para tarefas complexas. Todos os modelos foram lançados sob Apache 2.0 e suportam trabalho com texto, imagens e consultas multilingues.
Mistral Large 3: uma nova fronteira
O Mistral Large 3 é o carro-chefe da série, treinado em 3000 GPUs NVIDIA H200 do zero. É o primeiro modelo Mistral na arquitetura sparse mixture-of-experts (MoE) com 41B parâmetros ativos de um total de 675B. Nos testes da LMArena, o Mistral Large 3 ocupa o segundo lugar entre os modelos de linguagem abertos e demonstra resultados comparáveis aos melhores modelos instruction-tuned no mercado.
A diferença chave da arquitetura MoE é que o modelo não usa todos os parâmetros simultaneamente. Em vez disso, diferentes partes da rede são ativadas para diferentes tipos de consultas — isso torna a inferência mais rápida e mais barata do que usar completamente os 675B parâmetros. Essa abordagem permite dimensionar modelos sem crescimento proporcional dos requisitos de recursos computacionais. O modelo demonstra resultados particularmente fortes em tarefas multilíngues e compreensão de imagens. A empresa promete em breve lançar uma versão com capacidades ampliadas de raciocínio lógico e análise mais profunda de problemas complexos.
Parceria com NVIDIA para velocidade e escalabilidade
Mistral trabalhou com NVIDIA, vLLM e Red Hat para otimizar a inferência e implantação de modelos. Todos os modelos Mistral 3 foram treinados em GPUs NVIDIA Hopper, o que permitiu usar a memória HBM3e de alta largura de banda — um componente crítico para trabalhar com redes neurais tão massivas. A NVIDIA criou otimizações especializadas em TensorRT-LLM e SGLang para execução eficiente de instruções. Para o Mistral Large 3, foi adicionado suporte aos núcleos Blackwell eficientes e melhorada a arquitetura attention/MoE para contextos longos em sistemas GB200 NVL72. Isso permite servir cargas de trabalho de alto desempenho com latência mínima.
Os modelos compactos Ministral são facilmente implantáveis em máquinas locais: Em DGX Spark para soluções empresariais Em PCs RTX e laptops para desenvolvimento Em dispositivos Jetson para IoT e robótica Suporte para implantação de infraestrutura em nuvem até dispositivos edge. Essa integração vertical significa que os desenvolvedores obtêm um caminho único para executar os mesmos modelos do data center até dispositivos edge locais sem reescrever código.
Ministral 3: uma ferramenta poderosa para edge
Para computação edge e uso local, Mistral lançou o Ministral 3 em três tamanhos: 3B, 8B e 14B parâmetros. Cada tamanho está disponível em três variantes: modelo base, versão instruction-tuned para execução de instruções e versão com capacidades ampliadas de raciocínio lógico. Todas as variantes suportam trabalho com imagens e texto em mais de 30 idiomas, incluindo idiomas turcos e russo. Apesar da compactação, o Ministral 3 oferece o melhor equilíbrio de desempenho e custo da indústria entre modelos abertos. Isso é crítico para empresas que desejam executar IA localmente sem serviços em nuvem.
O que isso significa para a indústria de IA
Os modelos de linguagem abertos estão se tornando mais práticos e acessíveis. Com a licença Apache 2.0, qualquer pessoa pode usar, modificar e desenvolver modelos Mistral em projetos comerciais sem restrições. Para os desenvolvedores, isso significa mais flexibilidade na escolha da pilha de tecnologia; para as empresas, redução de custos em infraestrutura de IA e menor dependência de provedores em nuvem. Mistral 3 pode ser um ponto de inflexão no movimento em direção a sistemas de IA independentes e gerenciados localmente.
Quer parar de ler sobre IA e começar a usar?
AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.