Claude и AI-агенты сжигают токены быстрее прогнозов — бизнес учится «токеномике»

Компании, внедрившие AI-агентов для написания кода, столкнулись с «безумным» расходом токенов — в разы превышающим прогнозы. Silicon Valley–разработчик ПО и…

Redacción de Hamidun News

Monitoreo de AI · Wired

28 jun 2026· 2 min

Procesado por IA desde Wired; editado por Hamidun News

Claude и AI-агенты сжигают токены быстрее прогнозов — бизнес учится «токеномике» — Fuente: Wired. Collage: Hamidun News.

◐ Escuchar artículo

Las empresas que implementaron agentes de IA para escritura de código han enfrentado un problema inesperado: los costos reales de tokens resultaron ser significativamente superiores a las previsiones — y ahora sus ejecutivos están aprendiendo urgentemente una nueva disciplina llamada "tokenómica".

Qué Sucedió con los Presupuestos

Wired habló con varias empresas sobre cómo gestionan los gastos de agentes de IA en condiciones reales. Una fuente — director de una empresa de desarrollo de software de Silicon Valley — describió lo que está sucediendo con la palabra "locura": su equipo comenzó a usar activamente Claude de Anthropic para codificación, y el consumo de tokens se disparó a niveles que nadie había presupuestado. Una situación similar en una empresa de e-commerce: agentes de IA trabajando en segundo plano generan miles de tokens para tareas que parecen rutinarias — revisión de código, escritura de pruebas, refactorización.

Si un desarrollador dedica una hora a tal tarea, el agente "piensa" durante algunos minutos, pero genera continuamente tokens en el proceso — y la factura mensual resulta ser completamente diferente.

Por Qué los Agentes Queman Tokens Tan Rápido

Un token es una unidad de facturación con proveedores de IA. Cada solicitud a un modelo y cada respuesta se cobra según el recuento de tokens. Para chat regular esto es apenas perceptible. Pero los agentes de IA para codificación funcionan en un principio fundamentalmente diferente:

antes de cada acción leen todo el contexto del repositorio
dentro de una sola tarea llaman al modelo repetidamente
generan largas cadenas de razonamiento interno antes de responder
escriben, prueban y reescriben código hasta lograr el resultado deseado

Como resultado, una tarea que un desarrollador resuelve en una hora puede "costar" decenas de miles de tokens. Con tarifas altas para modelos potentes como Claude — esto son cientos de dólares por día laboral por empleado.

Cómo las Empresas Están Reestructurando su Enfoque

Los ejecutivos están comenzando a introducir el concepto de "tokenómica" — gestionar el consumo de tokens de la misma manera que solían gestionar los recursos de servidor o los gastos en la nube. Las primeras prácticas ya se han formado:

limitación de ventanas de contexto de agentes: los agentes ven solo la parte relevante de la base de código
almacenamiento en caché de prompts repetidos para que los tokens no se recalculen desde cero
enrutamiento de tareas: modelos económicos para trabajo rutinario, potentes para solicitudes complejas
monitoreo y alertas por gastos anormales
reevaluación del ROI de herramientas de IA basada en costos reales, no previstos

"Solíamos pensar en IA como una suscripción SaaS con precio fijo.

Ahora entendemos que es más como computación en la nube: el precio depende de cuánto uses."

Anthropic y otros proveedores ofrecen herramientas para monitoreo de gastos, pero la gestión de tokens sigue siendo un dolor de cabeza en el lado del cliente.

Qué Significa Esto

Una apuesta comercial en codificación por IA como forma de reducir gastos de desarrollo puede no recuperarse si no se contabiliza el costo real de los tokens. Las empresas que primero dominen la "tokenómica" — aprendan a optimizar el consumo sin sacrificar resultados — obtendrán una ventaja tangible sobre aquellas que gestionan los costos de IA a ciegas.

Hamidun News

Noticias de AI sin ruido. Selección editorial diaria de más de 400 fuentes. Producto de Zhemal Khamidun, Head of AI en Alpina Digital.

Canal de Telegram RSS hamidun.com

¿Quieres dejar de leer sobre IA y empezar a usarla?

AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.

🎓 Academy — 7 días gratis Consulta gratuita