Cohere lança Command A+: 218 bilhões de parâmetros para agentes em duas GPUs
Cohere lançou Command A+, um modelo aberto com 218 bilhões de parâmetros para fluxos de trabalho com agentes. Com quantização W4A4, ele roda em duas GPUs…
Processado por IA de MarkTechPost; editado por Hamidun News
Cohere lançou Command A+ — um modelo de código aberto de nova geração para fluxos de trabalho com agentes. São 218 bilhões de parâmetros em uma arquitetura Sparse Mixture-of-Experts, combinando quatro variantes anteriores do Command A em uma solução universal.
Imenso poder em um fator de forma compacto
O principal resultado é eficiência sem perda de qualidade. Graças à quantização W4A4 (gravação de 4 bits de pesos e ativações), o modelo é executado em duas GPUs H100. Modelos concorrentes com 300+ bilhões de parâmetros requerem oito a dezesseis placas gráficas.
Isso reduz os custos de implantação em quase quatro vezes. O suporte a 48 idiomas, incluindo russo, chinês e árabe, torna Command A+ verdadeiramente global. Para empresas construindo agentes para mercados internacionais, isto é crítico.
Mas o mais interessante é que este é o primeiro modelo de raciocínio multimodal da Cohere. Funciona com texto, vídeo e imagens simultaneamente, expandindo o escopo de tarefas desde o processamento de gravações de reuniões até a análise de capturas de tela e diagramas.
Para quem isto é útil
Código aberto é uma vantagem-chave. Desenvolvedores podem agora implantar Command A+ em seus próprios servidores sem dependência de nuvem. Para startups e empresas com dados confidenciais (fintech, healthcare), isto é crítico.
- Requisitos mínimos: dois H100 em vez de dezesseis
- Multimodalidade em um modelo (texto, vídeo, imagens)
- Suporte para 48 idiomas para mercados globais
- Otimização Sparse MoE: apenas 37B parâmetros funcionam simultaneamente
- Ciclo de vida simplificado: quatro modelos se tornaram um
Isto é especialmente importante para agentes que requerem atualizações frequentes e adaptação a processos específicos. Quando o modelo é executado localmente, o ciclo de desenvolvimento acelera.
Contexto de competição
Command A foi lançado anteriormente em quatro variantes diferentes — para busca, bate-papo, codificação e análise. Combinar em um modelo multimodal simplifica o ecossistema em meio a intensa competição com OpenAI, Anthropic e outros líderes. Cohere oferece às empresas uma base de código aberto poderosa com a qual pesquisadores, startups e clientes empresariais podem trabalhar.
O que isto significa
Modelos abertos grandes estão se tornando mais competitivos com os proprietários. Quando 218 bilhões de parâmetros são executados em duas placas gráficas em vez de um cluster de centenas de GPUs, a barreira de entrada cai drasticamente. Para empresas construindo seus próprios agentes, isto significa mais controle, custos menores e um ciclo de atualização mais rápido.
Precisa de IA funcionando dentro da sua empresa — não só no feed de notícias?
Eu construo IA em produção para empresas — CRM sob medida, ferramentas internas, agentes autônomos, automação de processos. Pertence a você, moldada ao seu processo, sem taxa por usuário. Feito por Zhemal Khamidun, CPO da AlpinaGPT (plataforma de IA, 6.000+ usuários).
O essencial da IA — uma vez por semana
Sete histórias que realmente importaram, escolhidas a dedo. Sem ruído nem releases.
Pronto! Verifique seu e-mail para a confirmação.