Ars Technica→ original

OpenAI apresentou um modelo ultrarrápido para programação para contornar os chips da Nvidia

A OpenAI anunciou a GPT-5.3-Codex-Spark, um modelo de linguagem especializado na escrita de código que apresenta um ganho de desempenho de 15 vezes. O…

Processado por IA de Ars Technica; editado por Hamidun News
OpenAI apresentou um modelo ultrarrápido para programação para contornar os chips da Nvidia
Fonte: Ars Technica. Colagem: Hamidun News.
◐ Ouvir artigo

A OpenAI apresentou GPT-5.3-Codex-Spark — um modelo especializado para geração de código que funciona 15 vezes mais rápido do que a versão anterior. Mas a verdadeira notícia não está tanto na velocidade, quanto na forma como a OpenAI conseguiu isso: a empresa otimizou a arquitetura para chips não padrão, do tamanho de um prato, contornando efetivamente a dependência crítica dos escassos processadores gráficos Nvidia. Este movimento demonstra o desejo da OpenAI de controlar toda a pilha — do software ao hardware físico — e simultaneamente destaca a crescente competição no mercado de processadores de IA especializados.

Nos últimos dois anos, a Nvidia se tornou um gargalo para todas as grandes empresas de IA. As GPUs H100 e A100, que se tornaram o padrão para treinamento de grandes modelos de linguagem, estão em enorme demanda, mas a oferta fica atrás. Os preços são altos, as remessas são atrasadas, e as restrições geopolíticas complicam ainda mais.

OpenAI, Meta, Google — todas estão procurando maneiras de reduzir a dependência da Nvidia ou otimizar o uso dos recursos disponíveis. A empresa x.AI de Elon Musk anunciou recentemente seu próprio chip, a Apple está fazendo o mesmo com seu Neural Engine, e a Amazon está investindo em processadores Trainium e Inferentia.

O mercado está se fragmentando, e a OpenAI decidiu não ficar para trás.

GPT-5.3-Codex-Spark é um desenvolvimento direcionado. Se modelos universais como GPT-4o devem lidar com múltiplas tarefas, então Codex está focado em uma coisa: escrever código o mais rápido e com precisão possível.

Isso permitiu que os engenheiros da OpenAI realizassem otimização significativa. A arquitetura foi reformulada para as especificidades da codificação, camadas computacionais desnecessárias foram removidas, operações tensoras foram reestruturadas. O resultado é a mesma saída de qualidade com custos computacionais mínimos.

Mas a principal mudança diz respeito à camada de hardware. A OpenAI desenvolveu ou repenso chips não padrão que funcionam com essa arquitetura nativamente. Esses processadores são mais compactos do que as GPUs padrão, integram-se mais facilmente, requerem menos energia e refrigeração — tudo o que torna os data centers mais baratos e resilientes a falhas.

O aumento de desempenho 15 vezes é impressionante, mas o número requer contexto. Provavelmente não significa que o modelo realiza computações diretas 15 vezes mais rápido. Trata-se do tempo end-to-end de geração de código — desde a solicitação do usuário até a saída pronta. Aqui as melhorias se somam: arquitetura otimizada, chips especializados, pipeline de processamento reformulado. Esta é uma abordagem típica para a indústria de IA: o algoritmo mais eficiente no hardware mais eficiente oferece o resultado máximo.

Para a indústria, isso significa várias coisas ao mesmo tempo. Primeiro, a pressão sobre a Nvidia aumenta. Se outras empresas começarem a usar com sucesso seus próprios chips, a demanda por GPU pode cair. Segundo, reforça a tendência de integração vertical nos laboratórios de IA. Apple, Google, Meta e agora OpenAI — todos estão desenvolvendo seus próprios chips. Terceiro, para desenvolvedores, essa é uma boa notícia: um gerador de código mais rápido e mais barato poderia reduzir o custo do uso de APIs e tornar assistentes de IA mais acessíveis.

Mas a OpenAI não se livrará completamente da Nvidia. Modelos universais ainda requerem GPUs poderosas durante o treinamento. Os próprios chips da OpenAI parecem ser otimizados especificamente para inferência — executar modelos já treinados. Isso faz sentido: treinamento acontece raramente, mas solicitações de usuários chegam constantemente. A OpenAI encontrou uma forma de controlar a camada onde pode lucrar com a escala. E este é o movimento estratégico correto.

ZK
Hamidun News
Notícias de AI sem ruído. Seleção editorial diária de mais de 400 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.

Quer parar de ler sobre IA e começar a usar?

AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.

O que você acha?
Carregando comentários…