General Compute aposta $300 milhões em SambaNova como o próximo líder em chips de IA
O provedor em nuvem General Compute (captou $15 milhões da FUSE VC) encomendou $300 milhões em chips SambaNova SN50. Eles geram 600-700 tokens por segundo em…
Processado por IA de TechCrunch; editado por Hamidun News
General Compute, novo provedor em nuvem para implantação de modelos de IA, apostou em SambaNova como o próximo campeão na corrida por chips especializados. A empresa encomendou $300 milhões em processadores SambaNova SN50 para inferência — um volume que a posiciona como o primeiro grande comprador desses chips entre provedores cloud de nova geração.
Uma aposta estranha em uma escolha segura
General Compute acabou de captar $15 milhões em seed round da FUSE VC com uma avaliação de $60 milhões. Os fundadores Finn Puklowski (CEO) e Jason Goodison (CTO) preferiram não competir por GPUs Nvidia escassas, desenvolvendo em vez disso sua própria estratégia. Em vez de competir por capacidade com Groq ou Cerebras, a empresa apostou no startup apoiado pela Intel SambaNova — um player menos famoso, mas promissor.
SambaNova: velocidade de processamento triplicada
Os números técnicos soam convincentes. O SambaNova SN50 gera 600-700 tokens por segundo para inferência, aproximadamente três vezes mais rápido do que GPUs padrão (cerca de 250 tokens/seg). A arquitetura promete superar não apenas GPUs, mas também os chips especializados concorrentes de Groq e Cerebras — embora em um cenário estreito de inferência, onde é necessária velocidade, mas não treinamento de novos modelos.
- Tokens/seg: 600-700 vs 250 em GPU
- Resfriamento a ar em vez de água
- Consumo de energia um nível abaixo dos concorrentes
- Compatibilidade com a infraestrutura de data center existente
Ar em vez de água
A vantagem operacional é frequentemente subestimada. Os chips SambaNova são resfriados a ar e não a água — isso é crítico para data centers que não estão preparados para atualizações caras de infraestrutura. Instalar um chip que não requer sistema de resfriamento líquido em um rack de servidor existente é uma solução muito prática para operadores de nuvem.
Por que tudo isso é necessário
A etapa de inferência em IA é um desafio separado da fase de treinamento. Quando o modelo já está treinado, é necessário minimizar latências nas respostas do usuário e maximizar a taxa de transferência. Neste contexto, Cerebras recentemente fez IPO avaliada em $57 bilhões, e Groq foi comprada pela Nvidia por $20 bilhões em dezembro. Em outras palavras, o mercado acredita que chips especializados para inferência não são uma questão periférica, mas um investimento sério.
O que isso significa
General Compute escolheu SambaNova não porque é a marca mais conhecida. A empresa investe em uma arquitetura que funciona melhor para uma tarefa específica — inferência em nuvem. Se SambaNova entregar os números prometidos de forma confiável, isso pode levar a uma mudança nos chips que os operadores escolhem. É o mesmo movimento que CoreWeave fez com Nvidia, mas na direção oposta — com um player menos desgastado, mas potencialmente mais eficiente.
Quer parar de ler sobre IA e começar a usar?
AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.