OpenAI apresentou seu primeiro modelo de AI baseado em chips da Cerebras
A OpenAI apresentou oficialmente o GPT-5.3-Codex-Spark, seu primeiro modelo rodando em hardware da startup Cerebras Systems. A novidade é uma versão…
Processado por IA de 36Kr (36氪); editado por Hamidun News
OpenAI deu um movimento estratégico em direção à independência tecnológica: a empresa apresentou GPT-5.3-Codex-Spark — o primeiro modelo de inteligência artificial desenvolvido especialmente para funcionar em chips Cerebras Systems. Este não é apenas um novo produto, mas uma demonstração de que OpenAI está pronta para diversificar suas parcerias de hardware e reduzir a dependência da Nvidia, que domina o mercado de aceleradores de IA.
Codex-Spark é posicionado como uma versão otimizada da ferramenta Codex bem conhecida para automação de escrita de código — por um lado, mais fácil de operar, por outro, significativamente mais rápido na execução de tarefas. O lançamento do modelo coincide com a intensificação da concorrência no segmento de assistentes de IA para desenvolvedores, onde OpenAI compete contra Google Gemini e Claude da Anthropic.
O contexto dessa decisão reside nas crescentes limitações sistêmicas que OpenAI enfrentou. A empresa compra globalmente GPUs Nvidia, mas isso cria uma vulnerabilidade: em qualquer momento, os suprimentos podem ser restritos, os preços podem subir, e Nvidia pode impor suas próprias condições. Cerebras Systems oferece uma alternativa com sua própria arquitetura WSE (Wafer Scale Engine) — um chip projetado diferentemente e que fornece um equilíbrio diferente entre rendimento e eficiência energética. Para OpenAI, isso é uma necessidade estratégica: diversificar fontes de desempenho significa uma posição de mercado mais resiliente e vulnerabilidade reduzida a fatores externos.
GPT-5.3-Codex-Spark não é inteiramente um novo modelo, mas uma versão otimizada do Codex, especificamente adaptada às características dos chips Cerebras. Esta é uma solução técnica importante: arquiteturas diferentes requerem abordagens diferentes para distribuição de memória, paralelização de computação e armazenamento em cache de dados. Os engenheiros do OpenAI redesenharam a estrutura do modelo para que ele use máxima e eficientemente a topologia específica do Cerebras. O resultado é um aumento notável de velocidade sem perda de precisão na geração de código. Para desenvolvedores, isso significa um loop de feedback mais rápido: solicitações de preenchimento automático de código serão executadas com latência mínima, o que é crítico para o ecossistema IDE e desenvolvimento contínuo.
O tamanho e o peso do modelo também desempenharam um papel nessa otimização. Codex-Spark é posicionado como uma versão "leve", o que permite um carregamento mais rápido do modelo na memória e reduz os requisitos de largura de banda da rede. Em um mundo onde cada milissegundo de latência afeta a experiência do usuário, isso importa. Especialmente no contexto da concorrência: Google Gemini e Claude já oferecem ferramentas integradas para manipulação de código, mas os desenvolvedores frequentemente criticam sua velocidade. Codex-Spark pode capturar parte desse público se for realmente mais rápido, mantendo alta precisão nas sugestões.
Esse movimento reflete uma tendência mais ampla da indústria: o monopólio de GPU da Nvidia é instável e todos os grandes atores estão começando a procurar alternativas. Apple desenvolveu seu próprio Neural Engine, Google investiu em TPU, Amazon criou Trainium e Inferentia. OpenAI, sendo uma desenvolvedora de modelos em vez de fabricante de chips, escolheu um caminho diferente: a parceria com Cerebras permite que ela permaneça flexível e não fique ligada a um único fornecedor.
O lançamento do Codex-Spark marca o início de uma nova fase na estratégia da OpenAI — não apenas criar os melhores modelos, mas também garantir que funcionem em hardware diversificado. Isso complica a vida dos concorrentes que ainda dependem do hardware padrão e fortalece a posição da OpenAI no mercado de ferramentas de IA para desenvolvedores. A questão agora é quão efetivamente essa estratégia funcionará na prática e se Cerebras consegue escalar seus chips rápido o suficiente para atender à demanda crescente.
Quer parar de ler sobre IA e começar a usar?
AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.