Cohere lança Command A+: 218 bilhões de parâmetros para agentes em duas GPUs
Cohere lançou Command A+, um modelo aberto com 218 bilhões de parâmetros para fluxos de trabalho com agentes. Com quantização W4A4, ele roda em duas GPUs H100,

Cohere lançou Command A+ — um modelo de código aberto de nova geração para fluxos de trabalho com agentes. São 218 bilhões de parâmetros em uma arquitetura Sparse Mixture-of-Experts, combinando quatro variantes anteriores do Command A em uma solução universal.
Imenso poder em um fator de forma compacto
O principal resultado é eficiência sem perda de qualidade. Graças à quantização W4A4 (gravação de 4 bits de pesos e ativações), o modelo é executado em duas GPUs H100. Modelos concorrentes com 300+ bilhões de parâmetros requerem oito a dezesseis placas gráficas.
Isso reduz os custos de implantação em quase quatro vezes. O suporte a 48 idiomas, incluindo russo, chinês e árabe, torna Command A+ verdadeiramente global. Para empresas construindo agentes para mercados internacionais, isto é crítico.
Mas o mais interessante é que este é o primeiro modelo de raciocínio multimodal da Cohere. Funciona com texto, vídeo e imagens simultaneamente, expandindo o escopo de tarefas desde o processamento de gravações de reuniões até a análise de capturas de tela e diagramas.
Para quem isto é útil
Código aberto é uma vantagem-chave. Desenvolvedores podem agora implantar Command A+ em seus próprios servidores sem dependência de nuvem. Para startups e empresas com dados confidenciais (fintech, healthcare), isto é crítico.
- Requisitos mínimos: dois H100 em vez de dezesseis
- Multimodalidade em um modelo (texto, vídeo, imagens)
- Suporte para 48 idiomas para mercados globais
- Otimização Sparse MoE: apenas 37B parâmetros funcionam simultaneamente
- Ciclo de vida simplificado: quatro modelos se tornaram um
Isto é especialmente importante para agentes que requerem atualizações frequentes e adaptação a processos específicos. Quando o modelo é executado localmente, o ciclo de desenvolvimento acelera.
Contexto de competição
Command A foi lançado anteriormente em quatro variantes diferentes — para busca, bate-papo, codificação e análise. Combinar em um modelo multimodal simplifica o ecossistema em meio a intensa competição com OpenAI, Anthropic e outros líderes. Cohere oferece às empresas uma base de código aberto poderosa com a qual pesquisadores, startups e clientes empresariais podem trabalhar.
O que isto significa
Modelos abertos grandes estão se tornando mais competitivos com os proprietários. Quando 218 bilhões de parâmetros são executados em duas placas gráficas em vez de um cluster de centenas de GPUs, a barreira de entrada cai drasticamente. Para empresas construindo seus próprios agentes, isto significa mais controle, custos menores e um ciclo de atualização mais rápido.