Claude и AI-агенты сжигают токены быстрее прогнозов — бизнес учится «токеномике»
Компании, внедрившие AI-агентов для написания кода, столкнулись с «безумным» расходом токенов — в разы превышающим прогнозы. Silicon Valley–разработчик ПО и…
Processado por IA de Wired; editado por Hamidun News
As empresas que implementaram agentes de IA para escrita de código enfrentaram um problema inesperado: os custos reais de tokens se mostraram significativamente superiores às previsões — e agora seus executivos estão aprendendo urgentemente uma nova disciplina chamada "tokenomia".
O Que Aconteceu Com os Orçamentos
A Wired conversou com várias empresas sobre como gerenciam despesas com agentes de IA em condições reais. Uma fonte — diretor de uma empresa de desenvolvimento de software do Vale do Silício — descreveu o que está acontecendo com a palavra "loucura": sua equipe começou a usar ativamente Claude da Anthropic para codificação, e o consumo de tokens disparou para níveis que ninguém tinha orçado. Situação similar em uma empresa de e-commerce: agentes de IA trabalhando em segundo plano geram milhares de tokens para tarefas que parecem rotineiras — review de código, escrita de testes, refatoração.
Se um desenvolvedor gasta uma hora em tal tarefa, o agente "pensa" por alguns minutos, mas continuamente gera tokens no processo — e a fatura mensal acaba sendo completamente diferente.
Por Que Agentes Queimam Tokens Tão Rápido
Um token é uma unidade de cobrança junto aos provedores de IA. Cada requisição para um modelo e cada resposta é cobrada com base na contagem de tokens. Para chat regular isso é quase imperceptível. Mas agentes de IA para codificação funcionam em um princípio fundamentalmente diferente:
- antes de cada ação eles leem todo o contexto do repositório
- dentro de uma única tarefa chamam o modelo repetidamente
- geram longas cadeias de raciocínio interno antes de responder
- escrevem, testam e reescrevem código até alcançar o resultado desejado
Como resultado, uma tarefa que um desenvolvedor resolve em uma hora pode "custar" dezenas de milhares de tokens. Com taxas altas para modelos poderosos como Claude — isso é centenas de dólares por dia de trabalho por funcionário.
Como as Empresas Estão Reestruturando a Abordagem
Executivos estão começando a introduzir o conceito de "tokenomia" — gerenciar o consumo de tokens da mesma forma que costumavam gerenciar recursos de servidor ou gastos na nuvem. Primeiras práticas já se formaram:
- limitação de janelas de contexto dos agentes: agentes veem apenas a parte relevante da base de código
- cache de prompts repetidos para que tokens não sejam recalculados do zero
- roteamento de tarefas: modelos baratos para trabalho rotineiro, modelos poderosos para requisições complexas
- monitoramento e alertas para gastos anormais
- reavaliação do ROI de ferramentas de IA com base em custos reais, não previstos
"Costumávamos pensar em IA como uma assinatura SaaS com preço fixo.
Agora entendemos que é mais como computação em nuvem: o preço depende de quanto você usa."
Anthropic e outros provedores oferecem ferramentas para monitoramento de gastos, mas o gerenciamento de tokens permanece um problema do lado do cliente.
O Que Isso Significa
Uma aposta comercial em codificação com IA como forma de reduzir despesas de desenvolvimento pode não se pagar se o verdadeiro custo dos tokens não for contabilizado. Empresas que primeiro dominarem "tokenomia" — aprenderem a otimizar o consumo sem sacrificar resultados — ganharão uma vantagem tangível sobre aquelas que gerenciam custos de IA às cegas.
Quer parar de ler sobre IA e começar a usar?
AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.
O essencial da IA — uma vez por semana
Sete histórias que realmente importaram, escolhidas a dedo. Sem ruído nem releases.
Pronto! Verifique seu e-mail para a confirmação.