Claude и AI-агенты сжигают токены быстрее прогнозов — бизнес учится «токеномике»
Компании, внедрившие AI-агентов для написания кода, столкнулись с «безумным» расходом токенов — в разы превышающим прогнозы. Silicon Valley–разработчик ПО и…
Procesado por IA desde Wired; editado por Hamidun News
Las empresas que implementaron agentes de IA para escritura de código han enfrentado un problema inesperado: los costos reales de tokens resultaron ser significativamente superiores a las previsiones — y ahora sus ejecutivos están aprendiendo urgentemente una nueva disciplina llamada "tokenómica".
Qué Sucedió con los Presupuestos
Wired habló con varias empresas sobre cómo gestionan los gastos de agentes de IA en condiciones reales. Una fuente — director de una empresa de desarrollo de software de Silicon Valley — describió lo que está sucediendo con la palabra "locura": su equipo comenzó a usar activamente Claude de Anthropic para codificación, y el consumo de tokens se disparó a niveles que nadie había presupuestado. Una situación similar en una empresa de e-commerce: agentes de IA trabajando en segundo plano generan miles de tokens para tareas que parecen rutinarias — revisión de código, escritura de pruebas, refactorización.
Si un desarrollador dedica una hora a tal tarea, el agente "piensa" durante algunos minutos, pero genera continuamente tokens en el proceso — y la factura mensual resulta ser completamente diferente.
Por Qué los Agentes Queman Tokens Tan Rápido
Un token es una unidad de facturación con proveedores de IA. Cada solicitud a un modelo y cada respuesta se cobra según el recuento de tokens. Para chat regular esto es apenas perceptible. Pero los agentes de IA para codificación funcionan en un principio fundamentalmente diferente:
- antes de cada acción leen todo el contexto del repositorio
- dentro de una sola tarea llaman al modelo repetidamente
- generan largas cadenas de razonamiento interno antes de responder
- escriben, prueban y reescriben código hasta lograr el resultado deseado
Como resultado, una tarea que un desarrollador resuelve en una hora puede "costar" decenas de miles de tokens. Con tarifas altas para modelos potentes como Claude — esto son cientos de dólares por día laboral por empleado.
Cómo las Empresas Están Reestructurando su Enfoque
Los ejecutivos están comenzando a introducir el concepto de "tokenómica" — gestionar el consumo de tokens de la misma manera que solían gestionar los recursos de servidor o los gastos en la nube. Las primeras prácticas ya se han formado:
- limitación de ventanas de contexto de agentes: los agentes ven solo la parte relevante de la base de código
- almacenamiento en caché de prompts repetidos para que los tokens no se recalculen desde cero
- enrutamiento de tareas: modelos económicos para trabajo rutinario, potentes para solicitudes complejas
- monitoreo y alertas por gastos anormales
- reevaluación del ROI de herramientas de IA basada en costos reales, no previstos
"Solíamos pensar en IA como una suscripción SaaS con precio fijo.
Ahora entendemos que es más como computación en la nube: el precio depende de cuánto uses."
Anthropic y otros proveedores ofrecen herramientas para monitoreo de gastos, pero la gestión de tokens sigue siendo un dolor de cabeza en el lado del cliente.
Qué Significa Esto
Una apuesta comercial en codificación por IA como forma de reducir gastos de desarrollo puede no recuperarse si no se contabiliza el costo real de los tokens. Las empresas que primero dominen la "tokenómica" — aprendan a optimizar el consumo sin sacrificar resultados — obtendrán una ventaja tangible sobre aquellas que gestionan los costos de IA a ciegas.
¿Quieres dejar de leer sobre IA y empezar a usarla?
AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.
Lo esencial de la IA — una vez por semana
Siete historias que de verdad importaron, elegidas a mano. Sin ruido ni notas de prensa.
¡Listo! Revisa tu correo para la confirmación.