OpenAI lança GPT-5.5: modelo agente mais forte que GPT-5.4, mas preço da API dobrou
OpenAI lançou GPT-5.5 e aposta em cenários de agentes: o modelo planeja etapas autonomamente, usa ferramentas e mantém melhor o contexto longo. Em benchmarks…
Processado por IA de AI News; editado por Hamidun News
A OpenAI em 23 de abril apresentou o GPT-5.5 e posicionou o lançamento não como uma atualização comum de modelo, mas como a base para agentes de IA em funcionamento. A empresa afirma que a nova versão planeja melhor, utiliza ferramentas e conclui tarefas complexas em múltiplas etapas sem solicitações constantes de humanos.
Para Que Aposta
A ideia principal do lançamento é que o GPT-5.5 deve funcionar não como um chatbot para respostas isoladas, mas como um executor de tarefas longas no computador. Segundo a descrição da OpenAI, o modelo é mais forte em programação de agentes, trabalho com interfaces, análise de dados, preparação de documentos e tarefas de pesquisa.
Em vez de um cenário onde usuários descrevem manualmente cada etapa, as empresas recebem a proposta de entregar ao modelo tarefas "sujas" com múltiplas partes e deixá-lo construir o plano por conta própria, verificar resultados intermediários e avançar para a resposta final. A OpenAI faz um ponto especial de que o crescimento nas capacidades não desacelerou o modelo em produção. O GPT-5.
5, segundo a empresa, mantém a latência por token do GPT-5.4, mas gasta menos tokens nas mesmas tarefas no Codex. O modelo também foi desenvolvido e implantado junto com os sistemas NVIDIA GB200 e GB300 NVL72, mostrando que os lançamentos de modelos de fronteira agora estão ligados não apenas a algoritmos, mas também à infraestrutura.
"Este é um passo real em direção ao tipo de computação que esperamos no futuro", disse
Greg Brockman.
Onde o Crescimento é Visível
O argumento mais forte da OpenAI são benchmarks relacionados não a questões acadêmicas, mas ao trabalho prático de agentes. O GPT-5.5 mostrou ganhos notáveis onde modelos precisam não apenas responder, mas planejar uma sequência de ações, invocar ferramentas, manter contexto longo e completar uma tarefa. Ao mesmo tempo, o lançamento não parece uma vitória incondicional em todas as categorias: em algumas avaliações externas, concorrentes mantêm posições fortes, especialmente onde a orquestração de ferramentas via MCP é importante.
- Terminal-Bench 2.0: 82,7% contra 75,1% para GPT-5.4 e 69,4% para Claude Opus 4.7.
- SWE-Bench Pro: 58,6% para resolver problemas reais do GitHub em uma única passagem.
- MRCR v2 em 1 milhão de tokens: 74,0% contra 36,6% para GPT-5.4, quase um salto duplo em contexto longo.
- BrowseComp na versão Pro: 90,1%, mas no MCP Atlas a liderança permanece com Claude Opus 4.7, e GPT-5.5 não tinha resultado publicado lá.
Preço e Acesso
A parte mais controversa do lançamento é a economia. Para API, a OpenAI estabeleceu o preço em $5 por milhão de tokens de entrada e $30 por milhão de tokens de saída, enquanto as taxas do GPT-5.4 eram a metade: $2,50 e $15 respectivamente.
O GPT-5.5 Pro é ainda mais caro—$30 para entrada e $180 para saída. A OpenAI argumenta que comparar apenas preços de tokens não é mais suficiente: o modelo resolve as mesmas tarefas com menos tokens, então o custo real de um cenário funcional, segundo a empresa, cresce não duas vezes, mas aproximadamente 20%.
O acesso ao GPT-5.5 foi inicialmente para ChatGPT e Codex para os planos pagos Plus, Pro, Business e Enterprise, com acesso por API seguindo em 24 de abril. Dentro da própria OpenAI, o lançamento é apresentado como já uma ferramenta funcional: a empresa diz que o Codex é usado semanalmente por mais de 85% dos funcionários.
Os exemplos incluem processamento de seis meses de solicitações de palestras públicas, análise de 24.771 formulários fiscais K-1 totalizando 71.637 páginas e automação de relatórios comerciais semanais, economizando 5–10 horas por semana para os funcionários.
O Que Isso Significa
O GPT-5.5 mostra para onde o mercado está indo: modelos agora são vendidos não como "mais um chat inteligente", mas como uma camada para trabalho digital autônomo. Para negócios, a questão não é mais apenas qual modelo é mais inteligente, mas quanto custa uma tarefa concluída, considerando tentativas, verificações e integração com ferramentas. Este é o campo onde a OpenAI pretende justificar seu preço mais alto.
Quer parar de ler sobre IA e começar a usar?
AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.