Habr AI→ original

OpenAI lança GPT-5.4: aposta em agentes de computador, não só em código

Em 5 de março de 2026, a OpenAI lançou o GPT-5.4, seu modelo principal com controle nativo do computador, tool search e modo xhigh para tarefas complexas. A…

Processado por IA de Habr AI; editado por Hamidun News
OpenAI lança GPT-5.4: aposta em agentes de computador, não só em código
Fonte: Habr AI. Colagem: Hamidun News.
◐ Ouvir artigo

A OpenAI lançou o GPT-5.4 em 5 de março de 2026 — um novo carro-chefe que combina codificação forte, raciocínio e controle nativo de computador. O foco principal do lançamento se deslocou de um "chatbot inteligente" para um agente de IA que não apenas responde perguntas, mas também pode executar cadeias de ações em interfaces e ferramentas de trabalho.

Aposta em Agentes

A principal novidade no GPT-5.4 é o Computer Use integrado. O modelo consegue trabalhar a partir de capturas de tela, gerenciar o cursor, clicar em botões, preencher formulários e verificar resultados.

Para desenvolvedores, isso significa uma transição mais madura da simples geração de texto para cenários de agentes: bots podem navegar em sites, executar etapas do navegador e realizar operações rotineiras sem um script codificado para cada clique. Isso não é mais um recurso para vídeos de demonstração, mas uma camada fundamental para processos comerciais reais onde um agente precisa ver a interface e confirmar que uma ação realmente funcionou. De acordo com os dados oficiais da OpenAI, a melhoria é particularmente notável onde o modelo deve agir autonomamente em vez de simplesmente escrever código no vazio.

No OSWorld-Verified, o GPT-5.4 alcançou 75,0% em comparação com 47,3% para o GPT-5.2, e no BrowseComp — 82,7% em comparação com 65,8%.

Enquanto isso, a melhoria no SWE-Bench Pro foi mais modesta: 57,7% em comparação com 55,6%. Esse é um bom sinal para quem constrói assistentes e agentes de fluxo de trabalho, e mais contido para quem esperava um avanço incondicional em programação.

  • Controle nativo de computador através de capturas de tela e ações de interface
  • Tool Search para grandes conjuntos de ferramentas sem inchar o prompt
  • Modo de raciocínio `xhigh` para tarefas pesadas
  • Até 1 milhão de tokens de contexto no Codex com suporte experimental
  • Taxa mais baixa de erros factuais em comparação com o GPT-5.2

O Que os Testes Mostraram

Na prática, a imagem não foi tão uniforme quanto nos benchmarks de apresentação. Em um teste visual, o modelo foi solicitado a construir um dashboard de casa inteligente complexo, depois renderizar o resultado em si e corrigir erros após autoverificação. A composição geral e o estilo eram reconhecíveis, mas os detalhes ficaram aquém: o texto se sobrepunha aos blocos, as margens saíam do lugar, alguns elementos eram cortados, e o termostato neomórfico anunciado se mostrou um círculo simplificado.

Ou seja, o modelo já compreende a sensação de "interface premium", mas ainda está longe de ser um desenvolvedor frontend sênior autônomo. Porém, no cenário de backend, o GPT-5.4 se mostrou mais convincente.

Em uma tarefa sobre um rate limiter pronto para produção para FastAPI e Redis, o modelo não se limitou a uma solução básica, mas construiu um esquema completo com tipagem rigorosa, script Lua para atomicidade e fallback local em caso de queda do Redis. Em um teste lógico com condições de agendamento conflitantes, também funcionou corretamente: não inventou uma resposta "de qualquer jeito", mas provou consistentemente que nenhuma solução existe. Este é um marcador importante de maturidade: o modelo reconhece contradições com mais frequência em vez de alucinar confientemente.

Preço e Disponibilidade

A OpenAI lançou o GPT-5.4 em 5 de março de 2026 diretamente na API, Codex e ChatGPT como GPT-5.4 Thinking.

A partir do lançamento, o modelo começou a substituir o GPT-5.2 Thinking para usuários pagos do ChatGPT Plus, Team e Pro, enquanto o GPT-5.4 Pro se tornou disponível nos níveis Pro e Enterprise.

Para desenvolvedores, essa pode ser uma notícia não menos importante que os próprios benchmarks: o novo carro-chefe não permaneceu como uma demonstração de laboratório, mas foi imediatamente integrado aos produtos de produção. O preço da API parece mais agressivo do que se poderia esperar do carro-chefe da OpenAI: $2,50 por milhão de tokens de entrada, $0,25 para entrada em cache e $15 por milhão de tokens de saída. Sim, o modelo é mais caro que o GPT-5.

2 por token, mas a OpenAI está apostando em melhor eficiência de tokens: se um agente resolver uma tarefa em menos etapas e não vagar tanto pelo contexto, a economia geral pode ser bem razoável até mesmo para equipes pequenas.

O Que Isso Significa

O GPT-5.4 não parece ser uma "substituição mágica do desenvolvedor", mas mostra claramente para onde o mercado está indo. A próxima competição não é apenas sobre qualidade de respostas, mas sobre a capacidade do modelo de ver interfaces, usar ferramentas, lembrar contexto longo e levar tarefas à conclusão. Para os negócios, isso significa uma coisa simples: o valor está se deslocando de prompts únicos para agentes que conseguem trabalhar dentro de processos reais. É nesses cenários que será decidido qual plataforma se adequa melhor ao trabalho real — em vez de demonstrações únicas impressionantes.

ZK
Hamidun News
Notícias de AI sem ruído. Seleção editorial diária de mais de 400 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.

Quer parar de ler sobre IA e começar a usar?

AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.

O que você acha?
Carregando comentários…