3DNews AI→ original

OpenAI apresenta GPT-5.4 mini e nano para código, subagentes e cargas de AI em grande escala

A OpenAI lançou GPT-5.4 mini e nano — versões compactas de seu modelo principal para tarefas em que velocidade e custo são críticos. Mini é mais de duas…

Processado por IA de 3DNews AI; editado por Hamidun News
OpenAI apresenta GPT-5.4 mini e nano para código, subagentes e cargas de AI em grande escala
Fonte: 3DNews AI. Colagem: Hamidun News.
◐ Ouvir artigo

OpenAI lançou GPT-5.4 mini e GPT-5.4 nano — duas versões compactas de sua linha de produtos principal, projetadas não para raciocínio recorde, mas para cenários rápidos e em larga escala. A empresa está apostando em modelos que são mais baratos, mais rápidos e, ainda assim, retêm uma parte significativa das capacidades da GPT-5.4 em tamanho completo.

Os pontos fortes da mini

GPT-5.4 mini é a senior das duas novidades. De acordo com a OpenAI, ela mostrou melhorias notáveis em relação à GPT-5 mini em programação, lógica, uso de ferramentas e análise multimodal, e se tornou mais de duas vezes mais rápida.

No benchmark SWE-Bench Pro, o modelo alcançou 54,4% em comparação com 45,7% da GPT-5 mini, e em OSWorld-Verified, que testa a capacidade de trabalhar com interfaces por meio de screenshots, apresentou 72,1% em comparação com 42,0% da versão mini anterior. Isso importa não apenas para gráficos bonitos. A OpenAI posiciona diretamente a GPT-5.

4 mini como um modelo de trabalho para tarefas onde a latência é perceptível ao usuário: autocompletar e corrigir código, ciclos rápidos de depuração, subagentes para operações auxiliares e sistemas que leem screenshots e interagem com interfaces. A ideia é simples: nem toda tarefa precisa ser enviada para o modelo mais caro se uma versão menor conseguir lidar com ela quase tão bem, mas significativamente mais rápido.

Onde a nano é útil

GPT-5.4 nano é o menor e mais barato modelo na nova linha. A OpenAI a recomenda não como um mecanismo de chat universal, mas como uma ferramenta utilitária para operações simples, porém frequentes.

Esses são cenários onde a throughput importa mais do que a profundidade do raciocínio: análise de fluxo de documentos, classificação, extração de campos, ranking de resultados e suporte para subtarefas de código simples. Até mesmo a nano alcançou 52,4% no SWE-Bench Pro, superando significativamente a GPT-5 mini. Juntas, mini e nano se encaixam bem em uma arquitetura onde um modelo grande planeja o trabalho e vários pequenos o executam em paralelo.

No Codex, esse é exatamente o cenário que a OpenAI está promovendo: GPT-5.4 pode coordenar o processo, enquanto GPT-5.4 mini assume tarefas específicas como busca em base de código, leitura de arquivos grandes e processamento de documentação.

Essa abordagem dividida ajuda a manter latência e orçamento sob controle.

  • Assistentes IA rápidos para escrever e editar código
  • Subagentes para busca em repositórios e análise de arquivos grandes
  • Ferramentas que entendem screenshots e gerenciam interfaces
  • Classificação, extração de dados e ranking em pipelines em larga escala
  • Execução mais econômica de tarefas auxiliares sem comprometer a qualidade geral do sistema

Acesso e preços

A partir de 17 de março de 2026, GPT-5.4 mini está disponível imediatamente em API, Codex e ChatGPT. Na API, o modelo suporta texto, imagens, chamada de funções, busca na web, busca de arquivo, computer use e skills.

A janela de contexto é de 400 mil tokens, e o preço é de $0,75 por milhão de tokens de entrada e $4,50 por milhão de tokens de saída. Para serviços com alto número de requisições paralelas, esse é um dos principais argumentos de venda. No Codex, mini usa apenas 30% da cota da GPT-5.

4 completa, então pode ser usada para subtarefas paralelas baratas. No ChatGPT, o modelo tem um papel mais limitado: para usuários Free e Go, está disponível através do modo Thinking, e para outros, funciona como fallback quando o limite de GPT-5.4 Thinking é atingido.

GPT-5.4 nano, por sua vez, está disponível apenas através da API e custa $0,20 por milhão de tokens de entrada e $1,25 por milhão de tokens de saída.

O que isso significa

A OpenAI está cada vez mais construindo uma linha de produtos não em torno de um "melhor" modelo, mas em torno de um conjunto de papéis: um modelo grande pensa e coordena, pequenos rapidamente lidam com rotina. Para desenvolvedores e produtos IA, isso é uma boa notícia: o custo de sistemas de agentes pode ser reduzido sem uma queda acentuada na qualidade, especialmente onde velocidade, paralelismo e alto volume de requisições importam.

ZK
Hamidun News
Notícias de AI sem ruído. Seleção editorial diária de mais de 400 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.

Quer parar de ler sobre IA e começar a usar?

AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.

O que você acha?
Carregando comentários…