OpenAI lança GPT-5.4: aposta em agentes de computador, não só em código
Em 5 de março de 2026, a OpenAI lançou o GPT-5.4, seu modelo principal com controle nativo do computador, tool search e modo xhigh para tarefas complexas. A…
Processado por IA de Habr AI; editado por Hamidun News
A OpenAI lançou o GPT-5.4 em 5 de março de 2026 — um novo carro-chefe que combina codificação forte, raciocínio e controle nativo de computador. O foco principal do lançamento se deslocou de um "chatbot inteligente" para um agente de IA que não apenas responde perguntas, mas também pode executar cadeias de ações em interfaces e ferramentas de trabalho.
Aposta em Agentes
A principal novidade no GPT-5.4 é o Computer Use integrado. O modelo consegue trabalhar a partir de capturas de tela, gerenciar o cursor, clicar em botões, preencher formulários e verificar resultados.
Para desenvolvedores, isso significa uma transição mais madura da simples geração de texto para cenários de agentes: bots podem navegar em sites, executar etapas do navegador e realizar operações rotineiras sem um script codificado para cada clique. Isso não é mais um recurso para vídeos de demonstração, mas uma camada fundamental para processos comerciais reais onde um agente precisa ver a interface e confirmar que uma ação realmente funcionou. De acordo com os dados oficiais da OpenAI, a melhoria é particularmente notável onde o modelo deve agir autonomamente em vez de simplesmente escrever código no vazio.
No OSWorld-Verified, o GPT-5.4 alcançou 75,0% em comparação com 47,3% para o GPT-5.2, e no BrowseComp — 82,7% em comparação com 65,8%.
Enquanto isso, a melhoria no SWE-Bench Pro foi mais modesta: 57,7% em comparação com 55,6%. Esse é um bom sinal para quem constrói assistentes e agentes de fluxo de trabalho, e mais contido para quem esperava um avanço incondicional em programação.
- Controle nativo de computador através de capturas de tela e ações de interface
- Tool Search para grandes conjuntos de ferramentas sem inchar o prompt
- Modo de raciocínio `xhigh` para tarefas pesadas
- Até 1 milhão de tokens de contexto no Codex com suporte experimental
- Taxa mais baixa de erros factuais em comparação com o GPT-5.2
O Que os Testes Mostraram
Na prática, a imagem não foi tão uniforme quanto nos benchmarks de apresentação. Em um teste visual, o modelo foi solicitado a construir um dashboard de casa inteligente complexo, depois renderizar o resultado em si e corrigir erros após autoverificação. A composição geral e o estilo eram reconhecíveis, mas os detalhes ficaram aquém: o texto se sobrepunha aos blocos, as margens saíam do lugar, alguns elementos eram cortados, e o termostato neomórfico anunciado se mostrou um círculo simplificado.
Ou seja, o modelo já compreende a sensação de "interface premium", mas ainda está longe de ser um desenvolvedor frontend sênior autônomo. Porém, no cenário de backend, o GPT-5.4 se mostrou mais convincente.
Em uma tarefa sobre um rate limiter pronto para produção para FastAPI e Redis, o modelo não se limitou a uma solução básica, mas construiu um esquema completo com tipagem rigorosa, script Lua para atomicidade e fallback local em caso de queda do Redis. Em um teste lógico com condições de agendamento conflitantes, também funcionou corretamente: não inventou uma resposta "de qualquer jeito", mas provou consistentemente que nenhuma solução existe. Este é um marcador importante de maturidade: o modelo reconhece contradições com mais frequência em vez de alucinar confientemente.
Preço e Disponibilidade
A OpenAI lançou o GPT-5.4 em 5 de março de 2026 diretamente na API, Codex e ChatGPT como GPT-5.4 Thinking.
A partir do lançamento, o modelo começou a substituir o GPT-5.2 Thinking para usuários pagos do ChatGPT Plus, Team e Pro, enquanto o GPT-5.4 Pro se tornou disponível nos níveis Pro e Enterprise.
Para desenvolvedores, essa pode ser uma notícia não menos importante que os próprios benchmarks: o novo carro-chefe não permaneceu como uma demonstração de laboratório, mas foi imediatamente integrado aos produtos de produção. O preço da API parece mais agressivo do que se poderia esperar do carro-chefe da OpenAI: $2,50 por milhão de tokens de entrada, $0,25 para entrada em cache e $15 por milhão de tokens de saída. Sim, o modelo é mais caro que o GPT-5.
2 por token, mas a OpenAI está apostando em melhor eficiência de tokens: se um agente resolver uma tarefa em menos etapas e não vagar tanto pelo contexto, a economia geral pode ser bem razoável até mesmo para equipes pequenas.
O Que Isso Significa
O GPT-5.4 não parece ser uma "substituição mágica do desenvolvedor", mas mostra claramente para onde o mercado está indo. A próxima competição não é apenas sobre qualidade de respostas, mas sobre a capacidade do modelo de ver interfaces, usar ferramentas, lembrar contexto longo e levar tarefas à conclusão. Para os negócios, isso significa uma coisa simples: o valor está se deslocando de prompts únicos para agentes que conseguem trabalhar dentro de processos reais. É nesses cenários que será decidido qual plataforma se adequa melhor ao trabalho real — em vez de demonstrações únicas impressionantes.
Quer parar de ler sobre IA e começar a usar?
AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.