36Kr (36氪)→ original

GPT-5.2: OpenAI ensinou o modelo a rodar 40% mais rápido (sem 'esteroides')

Você já parou para pensar por que seu chatbot favorito às vezes "congela" por alguns segundos antes de fornecer uma resposta que ele claramente já conhece?…

Processado por IA de 36Kr (36氪); editado por Hamidun News
GPT-5.2: OpenAI ensinou o modelo a rodar 40% mais rápido (sem 'esteroides')
Fonte: 36Kr (36氪). Colagem: Hamidun News.
◐ Ouvir artigo

Você já parou para pensar por que seu chatbot favorito às vezes "congela" por alguns segundos antes de fornecer uma resposta que ele claramente já conhece? No mundo dos grandes modelos de linguagem, tempo não é apenas dinheiro—é experiência do usuário e, em última análise, sobrevivência do produto no mercado. Hoje, a equipe OpenAI Developers jogou mais lenha na fogueira da corrida de velocidade, anunciando uma aceleração significativa de seus modelos atuais.

Estamos falando sobre GPT-5.2 e o modelo especializado Codex, que de repente ficaram 40% mais rápidos. O que há de mais intrigante nessa notícia é o aspecto técnico.

Os engenheiros da OpenAI enfatizaram que essa aceleração foi alcançada sem alterar a arquitetura do modelo e sem recalcular os pesos. Para quem não está imerso nos detalhes: normalmente, para tornar um modelo mais rápido, você tem que "aparar" (destilação) ou retreiná-lo do zero com menos parâmetros. Aqui vemos pura magia de otimização de inferência.

Parece que a equipe de Sam Altman encontrou uma forma de usar o hardware disponível de forma mais eficiente sem sacrificar o "cérebro" da rede neural.

Por que isso importa agora? Estamos em um ponto em que a qualidade das respostas dos principais modelos—seja GPT, Claude ou Gemini—atingiu um certo platô. A diferença em lógica está se tornando cada vez menos perceptível para o usuário médio. Agora a batalha está se deslocando para o plano da eficiência. Se seu modelo gera código da mesma qualidade que o do concorrente, mas faz isso quase 1,5 vezes mais rápido, os desenvolvedores o escolherão. Para Codex, isso é literalmente uma questão de vida ou morte: quando você está escrevendo código em uma IDE, até mesmo um atraso de meio segundo começa a irritar e quebra seu fluxo de pensamento.

Esse salto de 40% também afeta as posições das startups de hardware como Groq, que constroem seu marketing exclusivamente em velocidades malucotas de geração de tokens. Se a OpenAI conseguir continuar otimizando software nesse ritmo, a necessidade de "aceleradores" especializados pode não ser tão aguda quanto os analistas previram. Este é um sinal para todo o mercado: antes de comprar mais dez mil H100s, tente reescrever seus núcleos CUDA e otimizar o batching.

Para os negócios finais, essa atualização significa economia direta. Inferência mais rápida significa menos custos de tempo de servidor por solicitação. Ainda não está claro se isso se refletirá no custo de tokens na API, mas historicamente, a OpenAI sempre tentou converter eficiência técnica em reduções de preço para conquistar fatia de mercado. Provavelmente, nas próximas semanas, veremos uma atualização da lista de preços que fará Anthropic e Google coçarem a cabeça novamente.

Em última análise, estamos vendo que a era da "força bruta," quando o progresso era alcançado apenas aumentando a escala da computação, está gradualmente sendo complementada por uma era de elegante maestria em engenharia. A OpenAI está claramente sinalizando que não está apenas alugando enormes clusters da Microsoft, mas também sabe como extrair o máximo deles. Este é um bom sinal para toda a indústria: o potencial das arquiteturas atuais está longe de estar esgotado.

O principal: a OpenAI está deslocando o foco de "inteligência" para "velocidade," e 40% é apenas o começo. Os concorrentes estão preparados para tal otimização sem perder qualidade?

ZK
Hamidun News
Notícias de AI sem ruído. Seleção editorial diária de mais de 400 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.

Quer parar de ler sobre IA e começar a usar?

AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.

O que você acha?
Carregando comentários…