OpenAI apresentou um modelo ultrarrápido para programação para contornar os chips da Nvidia
A OpenAI anunciou a GPT-5.3-Codex-Spark, um modelo de linguagem especializado na escrita de código que apresenta um ganho de desempenho de 15 vezes. O…
Processado por IA de Ars Technica; editado por Hamidun News
A OpenAI apresentou GPT-5.3-Codex-Spark — um modelo especializado para geração de código que funciona 15 vezes mais rápido do que a versão anterior. Mas a verdadeira notícia não está tanto na velocidade, quanto na forma como a OpenAI conseguiu isso: a empresa otimizou a arquitetura para chips não padrão, do tamanho de um prato, contornando efetivamente a dependência crítica dos escassos processadores gráficos Nvidia. Este movimento demonstra o desejo da OpenAI de controlar toda a pilha — do software ao hardware físico — e simultaneamente destaca a crescente competição no mercado de processadores de IA especializados.
Nos últimos dois anos, a Nvidia se tornou um gargalo para todas as grandes empresas de IA. As GPUs H100 e A100, que se tornaram o padrão para treinamento de grandes modelos de linguagem, estão em enorme demanda, mas a oferta fica atrás. Os preços são altos, as remessas são atrasadas, e as restrições geopolíticas complicam ainda mais.
OpenAI, Meta, Google — todas estão procurando maneiras de reduzir a dependência da Nvidia ou otimizar o uso dos recursos disponíveis. A empresa x.AI de Elon Musk anunciou recentemente seu próprio chip, a Apple está fazendo o mesmo com seu Neural Engine, e a Amazon está investindo em processadores Trainium e Inferentia.
O mercado está se fragmentando, e a OpenAI decidiu não ficar para trás.
GPT-5.3-Codex-Spark é um desenvolvimento direcionado. Se modelos universais como GPT-4o devem lidar com múltiplas tarefas, então Codex está focado em uma coisa: escrever código o mais rápido e com precisão possível.
Isso permitiu que os engenheiros da OpenAI realizassem otimização significativa. A arquitetura foi reformulada para as especificidades da codificação, camadas computacionais desnecessárias foram removidas, operações tensoras foram reestruturadas. O resultado é a mesma saída de qualidade com custos computacionais mínimos.
Mas a principal mudança diz respeito à camada de hardware. A OpenAI desenvolveu ou repenso chips não padrão que funcionam com essa arquitetura nativamente. Esses processadores são mais compactos do que as GPUs padrão, integram-se mais facilmente, requerem menos energia e refrigeração — tudo o que torna os data centers mais baratos e resilientes a falhas.
O aumento de desempenho 15 vezes é impressionante, mas o número requer contexto. Provavelmente não significa que o modelo realiza computações diretas 15 vezes mais rápido. Trata-se do tempo end-to-end de geração de código — desde a solicitação do usuário até a saída pronta. Aqui as melhorias se somam: arquitetura otimizada, chips especializados, pipeline de processamento reformulado. Esta é uma abordagem típica para a indústria de IA: o algoritmo mais eficiente no hardware mais eficiente oferece o resultado máximo.
Para a indústria, isso significa várias coisas ao mesmo tempo. Primeiro, a pressão sobre a Nvidia aumenta. Se outras empresas começarem a usar com sucesso seus próprios chips, a demanda por GPU pode cair. Segundo, reforça a tendência de integração vertical nos laboratórios de IA. Apple, Google, Meta e agora OpenAI — todos estão desenvolvendo seus próprios chips. Terceiro, para desenvolvedores, essa é uma boa notícia: um gerador de código mais rápido e mais barato poderia reduzir o custo do uso de APIs e tornar assistentes de IA mais acessíveis.
Mas a OpenAI não se livrará completamente da Nvidia. Modelos universais ainda requerem GPUs poderosas durante o treinamento. Os próprios chips da OpenAI parecem ser otimizados especificamente para inferência — executar modelos já treinados. Isso faz sentido: treinamento acontece raramente, mas solicitações de usuários chegam constantemente. A OpenAI encontrou uma forma de controlar a camada onde pode lucrar com a escala. E este é o movimento estratégico correto.
Quer parar de ler sobre IA e começar a usar?
AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.