Habr AI→ original

Opus 4.7 da Anthropic consome mais tokens: inflação oculta com preços inalterados

No Opus 4.7 da Anthropic, o mesmo texto é tokenizado em mais tokens do que no Opus 4.6. Formalmente, preços e limites de contexto não mudaram, mas na prática…

Processado por IA de Habr AI; editado por Hamidun News
Opus 4.7 da Anthropic consome mais tokens: inflação oculta com preços inalterados
Fonte: Habr AI. Colagem: Hamidun News.
◐ Ouvir artigo

A Anthropic lançou o Claude Opus 4.7, e os testes iniciais pela API revelaram algo inesperado: o mesmo texto no novo modelo pode ocupar significativamente mais tokens do que no Opus 4.6. Com preços formalmente inalterados, isso representa um aumento discreto, mas real, nos custos.

Qual é o Problema

Um tokenizador é um componente que divide o texto em fragmentos antes de alimentá-lo no modelo. É precisamente o número desses fragmentos que determina o custo de uma requisição e o volume da janela de contexto ocupada. Quando a Anthropic muda o tokenizador entre versões, o mesmo prompt começa a "pesar" diferentemente. No caso do Opus 4.7, o peso aumentou. Se antes sua requisição típica levava 1.000 tokens, agora pode levar 1.300–1.500. O preço por milhão de tokens não mudou—mas você está consumindo mais tokens efetivamente pelo mesmo trabalho.

"Isso cria uma inflação oculta: os preços e limites estão listados como antes, mas na prática os custos podem aumentar" — de pesquisa do time

Kodik.

A Kodik, uma empresa que desenvolve um editor de código com suporte a vários modelos de IA, testou independentemente o comportamento do tokenizador pela API. Dados comparativos oficiais da Anthropic não foram publicados, então os desenvolvedores conduziram seus próprios testes e compartilharam suas descobertas.

Qual Conteúdo É Mais Afetado

O aumento de tokens não é uniforme entre diferentes tipos de texto. Com base nos dados disponíveis, o quadro se parece com isso:

  • Código — aumento perceptível, especialmente em linguagens com muitos caracteres especiais: operadores, colchetes, indentação
  • Strings técnicas (JSON, XML, YAML, SQL) — mudanças variam dependendo da estrutura; construções aninhadas podem crescer mais
  • Prompts do sistema — afetados da mesma forma que requisições do usuário; para produtos com longas instruções de sistema isso é particularmente sensível
  • Texto simples — crescimento moderado, menos perceptível em requisições curtas
  • Conteúdo misto (texto + código + JSON) — comportamento imprevisível; vale a pena testar para seu cenário específico

É importante considerar a escala: se um prompt cresce 20%, e você tem um milhão de requisições por dia, sua conta real mudará muito significativamente.

Por Que Isso É um Problema Sistêmico

A situação com Opus 4.7 não é uma exceção. O tokenizador pode mudar em qualquer modelo de qualquer provedor, e nem sempre isso aparece explicitamente nas notas de lançamento. Para times construindo produtos sobre APIs, isso cria vários riscos.

Surpresas de orçamento. Limites calculados com base em dados históricos podem quebrar inesperadamente após uma mudança de modelo—mesmo que as requisições em si não tenham mudado.

Estouro de janela de contexto. Um sistema que antes cabia em 128k tokens pode começar a truncar contexto ou retornar um erro após uma atualização.

Testes A/B injustos. Ao comparar a qualidade de duas versões de modelo nos mesmos dados, tokenizadores diferentes significam que os modelos recebem entrada tecnicamente diferente—isso afeta a interpretação dos resultados.

Regressão oculta em pipelines RAG. Se você empacota chunks por limite de tokens, uma mudança de tokenizador pode quebrar sua lógica de divisão sem um único erro nos logs.

O Que Isso Significa

Desenvolvedores que já usam Opus em produção ou planejam mudar para 4.7 devem rodar seus prompts reais pela API de tokenizador de ambas as versões antes de mudar. Isso levará algumas horas, mas permitirá que você avalie honestamente o aumento de custos e ajuste seu orçamento ou arquitetura adequadamente. O caso Opus 4.7 é um bom lembrete: ao atualizar um modelo, verifique não apenas a qualidade das respostas, mas também a eficiência da tokenização.

ZK
Hamidun News
Notícias de AI sem ruído. Seleção editorial diária de mais de 400 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.

Quer parar de ler sobre IA e começar a usar?

AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.

O que você acha?
Carregando comentários…