Habr AI→ original

OpenAI y Anthropic modifican el cálculo de costos de modelos de lenguaje: en 2026, el precio de la tarea es clave

La métrica fundamental del mercado de LLM está cambiando. OpenAI está trasladando sus planes corporativos a un modelo de precios más flexible basado en…

Procesado por IA desde Habr AI; editado por Hamidun News
OpenAI y Anthropic modifican el cálculo de costos de modelos de lenguaje: en 2026, el precio de la tarea es clave
Fuente: Habr AI. Collage: Hamidun News.
◐ Escuchar artículo

El mercado de grandes modelos de lenguaje entra en una nueva etapa: un token más barato ya no significa un presupuesto predecible. Casi simultáneamente, OpenAI y Anthropic han demostrado que en 2026, los negocios tendrán que calcular no solo el precio por millón de tokens, sino también el costo total de completar una tarea. Para empresas que construyen productos en escenarios de agentes, esto cambia la propia lógica de compras, planificación y economía de unidad.

La primera señal vino de Anthropic. La empresa pasó sus frameworks de agentes a facturación basada en uso, es decir, pago por el consumo real de tokens en lugar de suscripciones fijas. En la práctica, esto significa que algunos wrappers externos y servicios que anteriormente podían funcionar en modelo de tarifa plana pierden su anterior base financiera. Mientras la carga era relativamente predecible, la suscripción parecía conveniente para ambos, proveedores y clientes. Pero en sistemas de agentes, los costos computacionales crecen rápidamente: el modelo no simplemente responde a una solicitud, sino que planifica pasos, realiza múltiples llamadas, accede a herramientas, verifica los resultados nuevamente y puede ejecutar una larga cadena de acciones.

En paralelo, OpenAI cambió su enfoque para clientes corporativos. En los planes Enterprise, Business y EDU, la empresa introdujo precios más flexibles, donde el costo escala con el volumen de uso en lugar de permanecer rígidamente vinculado a licencias de seat. Para equipos de compras, este es un cambio importante. Hasta hace poco, se podía ver la suscripción como un elemento de gasto casi fijo, pero ahora el modelo se acerca a servicios en la nube: el pago depende mucho más de la intensidad real de uso.

Cuanto más activamente los empleados utilizan generación, búsqueda, análisis de documentos y funciones de agentes, más notablemente cambia la factura.

Esto no cancela otra tendencia que el mercado ha observado en los últimos dos años. De 2023 a 2025, las APIs realmente se abarataron, y el costo por millón de tokens para modelos de clase GPT-4 disminuyó. Por eso muchos equipos se acostumbraron a pensar bajo una regla simple: si el precio del token cae, entonces la implementación de LLM automáticamente se vuelve más rentable con el tiempo.

En 2026, esta regla ya no funciona sin salvedades. La métrica clave ahora no es el precio por token en sí, sino el costo de resolver una tarea específica. Si un resultado útil requiere que el sistema haga múltiples pasadas, use contexto largo, realice llamadas de herramientas, ejecute verificaciones adicionales y regenere múltiples veces, la factura total puede crecer incluso ante una API formalmente más barata.

Esto es especialmente notable en productos de agentes, donde un escenario que se ve para el usuario como una única acción puede internamente desglosarse en docenas de operaciones del modelo.

De esto se deduce una conclusión práctica para los equipos. El presupuesto de LLM ahora debe construirse alrededor del costo de la acción completada: cuánto cuesta un informe, un análisis de documento, una sesión de asistente o un flujo de trabajo de agente ejecutado con éxito. De aquí surgen nuevos requisitos de producto: eliminación de pasos innecesarios, control de la profundidad de razonamiento del agente, reducción de contexto, cachés, enrutamiento a modelos más económicos donde sea posible, y medición rigurosa de qué llamadas realmente crean valor.

Para CTOs, CPOs y equipos financieros, esto significa una transición de conversaciones sobre "IA barata" a economía operacional adecuada, donde lo que importa no es un precio bonito en una tabla, sino el costo de un resultado de negocio específico.

El punto principal de este cambio es que el mercado de LLM no ha dejado de abaratarse, sino de ser ingenuamente simple. Compute crunch en 2026 no es solo una cuestión de capacidad disponible, sino también de gestionar gastos. Los ganadores no serán las empresas que buscan el precio más bajo por token, sino aquellas que pueden calcular el costo del resultado final y diseñar sistemas para que cada token adicional aporte valor mensurable.

ZK
Hamidun News
Noticias de AI sin ruido. Selección editorial diaria de más de 400 fuentes. Producto de Zhemal Khamidun, Head of AI en Alpina Digital.

¿Quieres dejar de leer sobre IA y empezar a usarla?

AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.

¿Qué te parece?
Cargando comentarios…