OpenAI apresenta GPT-5.4 mini e nano para código, subagentes e cargas de AI em grande escala
A OpenAI lançou GPT-5.4 mini e nano — versões compactas de seu modelo principal para tarefas em que velocidade e custo são críticos. Mini é mais de duas…
Processado por IA de 3DNews AI; editado por Hamidun News
OpenAI lançou GPT-5.4 mini e GPT-5.4 nano — duas versões compactas de sua linha de produtos principal, projetadas não para raciocínio recorde, mas para cenários rápidos e em larga escala. A empresa está apostando em modelos que são mais baratos, mais rápidos e, ainda assim, retêm uma parte significativa das capacidades da GPT-5.4 em tamanho completo.
Os pontos fortes da mini
GPT-5.4 mini é a senior das duas novidades. De acordo com a OpenAI, ela mostrou melhorias notáveis em relação à GPT-5 mini em programação, lógica, uso de ferramentas e análise multimodal, e se tornou mais de duas vezes mais rápida.
No benchmark SWE-Bench Pro, o modelo alcançou 54,4% em comparação com 45,7% da GPT-5 mini, e em OSWorld-Verified, que testa a capacidade de trabalhar com interfaces por meio de screenshots, apresentou 72,1% em comparação com 42,0% da versão mini anterior. Isso importa não apenas para gráficos bonitos. A OpenAI posiciona diretamente a GPT-5.
4 mini como um modelo de trabalho para tarefas onde a latência é perceptível ao usuário: autocompletar e corrigir código, ciclos rápidos de depuração, subagentes para operações auxiliares e sistemas que leem screenshots e interagem com interfaces. A ideia é simples: nem toda tarefa precisa ser enviada para o modelo mais caro se uma versão menor conseguir lidar com ela quase tão bem, mas significativamente mais rápido.
Onde a nano é útil
GPT-5.4 nano é o menor e mais barato modelo na nova linha. A OpenAI a recomenda não como um mecanismo de chat universal, mas como uma ferramenta utilitária para operações simples, porém frequentes.
Esses são cenários onde a throughput importa mais do que a profundidade do raciocínio: análise de fluxo de documentos, classificação, extração de campos, ranking de resultados e suporte para subtarefas de código simples. Até mesmo a nano alcançou 52,4% no SWE-Bench Pro, superando significativamente a GPT-5 mini. Juntas, mini e nano se encaixam bem em uma arquitetura onde um modelo grande planeja o trabalho e vários pequenos o executam em paralelo.
No Codex, esse é exatamente o cenário que a OpenAI está promovendo: GPT-5.4 pode coordenar o processo, enquanto GPT-5.4 mini assume tarefas específicas como busca em base de código, leitura de arquivos grandes e processamento de documentação.
Essa abordagem dividida ajuda a manter latência e orçamento sob controle.
- Assistentes IA rápidos para escrever e editar código
- Subagentes para busca em repositórios e análise de arquivos grandes
- Ferramentas que entendem screenshots e gerenciam interfaces
- Classificação, extração de dados e ranking em pipelines em larga escala
- Execução mais econômica de tarefas auxiliares sem comprometer a qualidade geral do sistema
Acesso e preços
A partir de 17 de março de 2026, GPT-5.4 mini está disponível imediatamente em API, Codex e ChatGPT. Na API, o modelo suporta texto, imagens, chamada de funções, busca na web, busca de arquivo, computer use e skills.
A janela de contexto é de 400 mil tokens, e o preço é de $0,75 por milhão de tokens de entrada e $4,50 por milhão de tokens de saída. Para serviços com alto número de requisições paralelas, esse é um dos principais argumentos de venda. No Codex, mini usa apenas 30% da cota da GPT-5.
4 completa, então pode ser usada para subtarefas paralelas baratas. No ChatGPT, o modelo tem um papel mais limitado: para usuários Free e Go, está disponível através do modo Thinking, e para outros, funciona como fallback quando o limite de GPT-5.4 Thinking é atingido.
GPT-5.4 nano, por sua vez, está disponível apenas através da API e custa $0,20 por milhão de tokens de entrada e $1,25 por milhão de tokens de saída.
O que isso significa
A OpenAI está cada vez mais construindo uma linha de produtos não em torno de um "melhor" modelo, mas em torno de um conjunto de papéis: um modelo grande pensa e coordena, pequenos rapidamente lidam com rotina. Para desenvolvedores e produtos IA, isso é uma boa notícia: o custo de sistemas de agentes pode ser reduzido sem uma queda acentuada na qualidade, especialmente onde velocidade, paralelismo e alto volume de requisições importam.
Quer parar de ler sobre IA e começar a usar?
AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.