Amazon Bedrock incorpora atribución detallada de costos de inference por usuarios y aplicaciones

Q: ¿Cuál es la fuente?

Publicado originalmente en AWS Machine Learning Blog. Hamidun News procesa y adapta los materiales con IA.

Q: ¿Cuándo se publicó?

2 may 2026. Tiempo de lectura: 3 min.

AWS habilitó en Amazon Bedrock una atribución detallada de costos de inference. La plataforma ahora vincula automáticamente los costos al usuario de IAM, al…

Redacción de Hamidun News

Monitoreo de AI · AWS Machine Learning Blog

2 may 2026· 3 min

Procesado por IA desde AWS Machine Learning Blog; editado por Hamidun News

Amazon Bedrock incorpora atribución detallada de costos de inference por usuarios y aplicaciones — Fuente: AWS Machine Learning Blog. Collage: Hamidun News.

◐ Escuchar artículo

AWS lanzó el 17 de abril de 2026 una función de atribución de costos granular para Amazon Bedrock — rastreo detallado de gastos de inferencia. Ahora los gastos se pueden vincular automáticamente a un usuario específico, aplicación, rol IAM o tenant sin cambiar los escenarios de llamada de modelos existentes.

Cómo funciona

Bedrock comenzó a enviar a AWS Billing datos sobre qué principal IAM envió una solicitud al modelo. Esto puede ser un usuario IAM común, un rol de aplicación, una sesión federada temporal a través de Okta o Entra ID, así como una clave API de Bedrock si está asociada a una identidad IAM. El informe CUR 2.

0 recibe un nuevo campo line_item_iam_principal y por line_item_usage_type puede ver qué modelo se utilizó, en qué región y si el dinero se destinó a tokens de entrada o salida. Además de esto, AWS ofrece conectar etiquetas de asignación de costos. Se pueden adjuntar directamente a usuarios y roles IAM o pasarse como etiquetas de sesión durante la autorización federada y AssumeRole.

Una vez activadas en facturación, estas etiquetas aparecen tanto en CUR 2.0 como en Cost Explorer, donde los gastos ya se pueden agregar por equipo, proyecto, centro de costos o tenant. La función en sí está disponible en regiones comerciales sin costo adicional, pero requiere habilitar la exportación de principal IAM a CUR 2.

0 y esperar a que aparezcan las etiquetas dentro de 24–48 horas.

"Entender exactamente quién está gastando dinero en inferencia es el

primer paso hacia chargeback, previsión y optimización."

Cuatro escenarios de contabilidad

AWS describe cuatro esquemas típicos donde la nueva atribución es especialmente útil. La lógica es simple: quien llama a Bedrock se convierte en la unidad de contabilidad. Pero el método de etiquetado depende de si una persona, servicio, sesión SSO corporativa o una puerta de enlace LLM común está trabajando con los modelos. La diferencia es importante porque determina dónde se almacenarán el identificador de la parte que realiza la llamada y las etiquetas para la posterior agregación de costos en informes y alertas.

Usuarios IAM y claves API — adecuado para equipos pequeños y prototipos: puede ver el gasto de cada desarrollador por separado.
Roles IAM para aplicaciones — conveniente para servicios de producción: los gastos se dividen por backends, trabajos por lotes y proyectos.
Usuarios federados a través de IdP — los usuarios corporativos son visibles por nombre de sesión y etiquetas de SAML u OIDC.
Puerta de enlace LLM o proxy — para SaaS y plataformas de IA internas donde necesita un desglose por usuarios y tenants, no una línea única para toda la puerta de enlace.

La opción más no trivial es la puerta de enlace. Si el proxy accede a Bedrock bajo un único rol, la facturación solo verá ese rol y perderá granularidad. AWS sugiere resolver esto mediante AssumeRole para cada usuario o tenant con role-session-name y etiquetas pasadas. Las credenciales obtenidas se pueden almacenar en caché durante hasta una hora, por lo que el modelo no requiere llamadas STS en cada solicitud. El límite STS predeterminado para AssumeRole es de 500 llamadas por segundo por cuenta, y esto es importante tener en cuenta en sistemas de alto rendimiento.

Efecto práctico para equipos

Para FinOps y plataformas de IA, esto cierra una brecha de larga data: anteriormente, los gastos de Bedrock a menudo solo eran visibles a nivel de cuenta o un único usuario de servicio, y luego los equipos tenían que construir su propia capa de logging y distribuir costos manualmente. Ahora AWS proporciona un mecanismo nativo de chargeback y showback a través de las mismas identidades y etiquetas IAM que las empresas ya utilizan para acceso y gobernanza. Un beneficio adicional es la capacidad de entender rápidamente quién está utilizando modelos costosos como Opus, quién está en configuraciones más ligeras y dónde el presupuesto se consume por tokens de salida.

Para equipos de ingeniería, el valor va más allá de las finanzas. Si cada microservicio tiene su propio rol y los empleados tienen su propia sesión federada, entonces el mismo mecanismo simultáneamente mejora la seguridad y la transparencia. En SaaS multiinquilino, esto es especialmente útil: puede comparar el costo de atender clientes, construir precios internos y establecer alertas en Cost Explorer por etiquetas.

Esencialmente, AWS convierte la identidad de llamada del modelo en una etiqueta financiera completa que se puede usar para construir informes sin una canalización de datos separada.

Qué significa esto

Amazon Bedrock se vuelve notablemente más conveniente para empresas que escalan GenAI no en decenas de solicitudes de demostración, sino en equipos, servicios y clientes reales. Cuanto más tráfico de IA tiene un negocio, más importante es ver no solo la factura total, sino la fuente específica de gastos.

Hamidun News

Noticias de AI sin ruido. Selección editorial diaria de más de 400 fuentes. Producto de Zhemal Khamidun, Head of AI en Alpina Digital.

Canal de Telegram RSS hamidun.com

¿Quieres dejar de leer sobre IA y empezar a usarla?

AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.

🎓 Academy — 7 días gratis Consulta gratuita