Wired→ original

Claude и AI-агенты сжигают токены быстрее прогнозов — бизнес учится «токеномике»

Компании, внедрившие AI-агентов для написания кода, столкнулись с «безумным» расходом токенов — в разы превышающим прогнозы. Silicon Valley–разработчик ПО и…

Processado por IA de Wired; editado por Hamidun News
Claude и AI-агенты сжигают токены быстрее прогнозов — бизнес учится «токеномике»
Fonte: Wired. Colagem: Hamidun News.
◐ Ouvir artigo

As empresas que implementaram agentes de IA para escrita de código enfrentaram um problema inesperado: os custos reais de tokens se mostraram significativamente superiores às previsões — e agora seus executivos estão aprendendo urgentemente uma nova disciplina chamada "tokenomia".

O Que Aconteceu Com os Orçamentos

A Wired conversou com várias empresas sobre como gerenciam despesas com agentes de IA em condições reais. Uma fonte — diretor de uma empresa de desenvolvimento de software do Vale do Silício — descreveu o que está acontecendo com a palavra "loucura": sua equipe começou a usar ativamente Claude da Anthropic para codificação, e o consumo de tokens disparou para níveis que ninguém tinha orçado. Situação similar em uma empresa de e-commerce: agentes de IA trabalhando em segundo plano geram milhares de tokens para tarefas que parecem rotineiras — review de código, escrita de testes, refatoração.

Se um desenvolvedor gasta uma hora em tal tarefa, o agente "pensa" por alguns minutos, mas continuamente gera tokens no processo — e a fatura mensal acaba sendo completamente diferente.

Por Que Agentes Queimam Tokens Tão Rápido

Um token é uma unidade de cobrança junto aos provedores de IA. Cada requisição para um modelo e cada resposta é cobrada com base na contagem de tokens. Para chat regular isso é quase imperceptível. Mas agentes de IA para codificação funcionam em um princípio fundamentalmente diferente:

  • antes de cada ação eles leem todo o contexto do repositório
  • dentro de uma única tarefa chamam o modelo repetidamente
  • geram longas cadeias de raciocínio interno antes de responder
  • escrevem, testam e reescrevem código até alcançar o resultado desejado

Como resultado, uma tarefa que um desenvolvedor resolve em uma hora pode "custar" dezenas de milhares de tokens. Com taxas altas para modelos poderosos como Claude — isso é centenas de dólares por dia de trabalho por funcionário.

Como as Empresas Estão Reestruturando a Abordagem

Executivos estão começando a introduzir o conceito de "tokenomia" — gerenciar o consumo de tokens da mesma forma que costumavam gerenciar recursos de servidor ou gastos na nuvem. Primeiras práticas já se formaram:

  • limitação de janelas de contexto dos agentes: agentes veem apenas a parte relevante da base de código
  • cache de prompts repetidos para que tokens não sejam recalculados do zero
  • roteamento de tarefas: modelos baratos para trabalho rotineiro, modelos poderosos para requisições complexas
  • monitoramento e alertas para gastos anormais
  • reavaliação do ROI de ferramentas de IA com base em custos reais, não previstos
"Costumávamos pensar em IA como uma assinatura SaaS com preço fixo.

Agora entendemos que é mais como computação em nuvem: o preço depende de quanto você usa."

Anthropic e outros provedores oferecem ferramentas para monitoramento de gastos, mas o gerenciamento de tokens permanece um problema do lado do cliente.

O Que Isso Significa

Uma aposta comercial em codificação com IA como forma de reduzir despesas de desenvolvimento pode não se pagar se o verdadeiro custo dos tokens não for contabilizado. Empresas que primeiro dominarem "tokenomia" — aprenderem a otimizar o consumo sem sacrificar resultados — ganharão uma vantagem tangível sobre aquelas que gerenciam custos de IA às cegas.

ZK
Hamidun News
Notícias de AI sem ruído. Seleção editorial diária de mais de 400 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.

Quer parar de ler sobre IA e começar a usar?

AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.

O que você acha?
Carregando comentários…