Amazon Bedrock recebe atribuição detalhada de custos de inference por usuários e aplicações
A AWS ativou no Amazon Bedrock a atribuição detalhada de custos de inference. A plataforma agora vincula automaticamente os custos ao usuário do IAM, à…
Processado por IA de AWS Machine Learning Blog; editado por Hamidun News
AWS lançou em 17 de abril de 2026 uma função de atribuição de custos granular para o Amazon Bedrock — rastreamento detalhado de despesas de inferência. Agora as despesas podem ser automaticamente vinculadas a um usuário específico, aplicação, função IAM ou tenant sem alterar os cenários existentes de chamadas de modelos.
Como funciona
O Bedrock começou a enviar ao AWS Billing dados sobre qual principal IAM enviou uma solicitação ao modelo. Isso pode ser um usuário IAM comum, uma função de aplicação, uma sessão federada temporária via Okta ou Entra ID, bem como uma chave API do Bedrock se estiver associada a uma identidade IAM. O relatório CUR 2.
0 recebe um novo campo line_item_iam_principal e por line_item_usage_type você pode ver qual modelo foi usado, em qual região e se o dinheiro foi para tokens de entrada ou saída. Além disso, a AWS oferece a conexão de tags de alocação de custos. Elas podem ser anexadas diretamente aos usuários e funções IAM ou passadas como tags de sessão durante autorização federada e AssumeRole.
Uma vez ativadas no billing, essas tags aparecem tanto no CUR 2.0 quanto no Cost Explorer, onde as despesas já podem ser agregadas por equipe, projeto, centro de custos ou tenant. A função em si está disponível em regiões comerciais sem custo adicional, mas exige a ativação da exportação de principal IAM para CUR 2.
0 e aguardar o aparecimento de tags dentro de 24–48 horas.
"Entender exatamente quem está gastando dinheiro em inferência é o
primeiro passo para chargeback, previsão e otimização."
Quatro cenários de contabilização
A AWS descreve quatro esquemas típicos onde a nova atribuição é especialmente útil. A lógica é simples: quem chama o Bedrock se torna a unidade de contabilização. Mas o método de marcação depende de se uma pessoa, serviço, sessão SSO corporativa ou um gateway LLM comum está trabalhando com os modelos. A diferença importa porque determina onde o identificador da parte chamadora e tags para subsequente agregação de custos em relatórios e alertas serão armazenados.
- Usuários IAM e chaves API — adequado para equipes pequenas e protótipos: você pode ver os gastos de cada desenvolvedor separadamente.
- Funções IAM para aplicações — conveniente para serviços de produção: despesas são divididas por backends, trabalhos em lote e projetos.
- Usuários federados via IdP — usuários corporativos são visíveis pelo nome da sessão e tags do SAML ou OIDC.
- Gateway LLM ou proxy — para SaaS e plataformas de IA internas onde você precisa de um detalhamento por usuários e tenants, não uma única linha para todo o gateway.
A opção mais não trivial é o gateway. Se o proxy acessa o Bedrock sob uma única função, o billing verá apenas essa função e perderá granularidade. A AWS sugere resolver isso por AssumeRole para cada usuário ou tenant com role-session-name e tags passadas. As credenciais obtidas podem ser armazenadas em cache por até uma hora, então o modelo não exige chamadas de STS em cada solicitação. O limite padrão de STS para AssumeRole é 500 chamadas por segundo por conta, e isso é importante levar em conta em sistemas de alto throughput.
Efeito prático para equipes
Para FinOps e plataformas de IA, isso fecha uma lacuna de longa data: anteriormente, as despesas do Bedrock eram frequentemente visíveis apenas no nível de conta ou um único usuário de serviço, e então as equipes tinham que construir sua própria camada de logging e distribuir custos manualmente. Agora a AWS fornece um mecanismo nativo de chargeback e showback através das mesmas identidades IAM e tags que as empresas já usam para acesso e governança. Um benefício adicional é a capacidade de entender rapidamente quem está usando modelos caros como Opus, quem está em configurações mais leves e onde o orçamento é consumido por tokens de saída.
Para equipes de engenharia, o valor vai além das finanças. Se cada microsserviço tem sua própria função e funcionários têm sua própria sessão federada, então o mesmo mecanismo simultaneamente melhora segurança e transparência. Em SaaS multi-tenant isso é especialmente útil: você pode comparar o custo de atendimento de clientes, construir preços internos e definir alertas no Cost Explorer por tags.
Essencialmente, a AWS transforma a identidade de chamada do modelo em um rótulo financeiro completo que pode ser usado para construir relatórios sem um pipeline de dados separado.
O que isso significa
O Amazon Bedrock se torna notavelmente mais conveniente para empresas escalando GenAI não em dezenas de solicitações de demonstração, mas em equipes, serviços e clientes reais. Quanto mais tráfego de IA um negócio tem, mais importante é ver não apenas a conta total, mas a fonte específica de despesas.
Quer parar de ler sobre IA e começar a usar?
AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.