TechCrunch→ original

General Compute aposta $300 milhões em SambaNova como o próximo líder em chips de IA

O provedor em nuvem General Compute (captou $15 milhões da FUSE VC) encomendou $300 milhões em chips SambaNova SN50. Eles geram 600-700 tokens por segundo em…

Processado por IA de TechCrunch; editado por Hamidun News
General Compute aposta $300 milhões em SambaNova como o próximo líder em chips de IA
Fonte: TechCrunch. Colagem: Hamidun News.
◐ Ouvir artigo

General Compute, novo provedor em nuvem para implantação de modelos de IA, apostou em SambaNova como o próximo campeão na corrida por chips especializados. A empresa encomendou $300 milhões em processadores SambaNova SN50 para inferência — um volume que a posiciona como o primeiro grande comprador desses chips entre provedores cloud de nova geração.

Uma aposta estranha em uma escolha segura

General Compute acabou de captar $15 milhões em seed round da FUSE VC com uma avaliação de $60 milhões. Os fundadores Finn Puklowski (CEO) e Jason Goodison (CTO) preferiram não competir por GPUs Nvidia escassas, desenvolvendo em vez disso sua própria estratégia. Em vez de competir por capacidade com Groq ou Cerebras, a empresa apostou no startup apoiado pela Intel SambaNova — um player menos famoso, mas promissor.

SambaNova: velocidade de processamento triplicada

Os números técnicos soam convincentes. O SambaNova SN50 gera 600-700 tokens por segundo para inferência, aproximadamente três vezes mais rápido do que GPUs padrão (cerca de 250 tokens/seg). A arquitetura promete superar não apenas GPUs, mas também os chips especializados concorrentes de Groq e Cerebras — embora em um cenário estreito de inferência, onde é necessária velocidade, mas não treinamento de novos modelos.

  • Tokens/seg: 600-700 vs 250 em GPU
  • Resfriamento a ar em vez de água
  • Consumo de energia um nível abaixo dos concorrentes
  • Compatibilidade com a infraestrutura de data center existente

Ar em vez de água

A vantagem operacional é frequentemente subestimada. Os chips SambaNova são resfriados a ar e não a água — isso é crítico para data centers que não estão preparados para atualizações caras de infraestrutura. Instalar um chip que não requer sistema de resfriamento líquido em um rack de servidor existente é uma solução muito prática para operadores de nuvem.

Por que tudo isso é necessário

A etapa de inferência em IA é um desafio separado da fase de treinamento. Quando o modelo já está treinado, é necessário minimizar latências nas respostas do usuário e maximizar a taxa de transferência. Neste contexto, Cerebras recentemente fez IPO avaliada em $57 bilhões, e Groq foi comprada pela Nvidia por $20 bilhões em dezembro. Em outras palavras, o mercado acredita que chips especializados para inferência não são uma questão periférica, mas um investimento sério.

O que isso significa

General Compute escolheu SambaNova não porque é a marca mais conhecida. A empresa investe em uma arquitetura que funciona melhor para uma tarefa específica — inferência em nuvem. Se SambaNova entregar os números prometidos de forma confiável, isso pode levar a uma mudança nos chips que os operadores escolhem. É o mesmo movimento que CoreWeave fez com Nvidia, mas na direção oposta — com um player menos desgastado, mas potencialmente mais eficiente.

ZK
Hamidun News
Notícias de AI sem ruído. Seleção editorial diária de mais de 400 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.

Quer parar de ler sobre IA e começar a usar?

AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.

O que você acha?
Carregando comentários…