AWS Machine Learning Blog→ original

Amazon Bedrock ajoute une attribution détaillée des coûts d’inference par utilisateurs et applications

AWS a activé dans Amazon Bedrock une attribution détaillée des coûts d’inference. La plateforme associe désormais automatiquement les coûts à l’utilisateur…

Traité par IA depuis AWS Machine Learning Blog ; édité par Hamidun News
Amazon Bedrock ajoute une attribution détaillée des coûts d’inference par utilisateurs et applications
Source : AWS Machine Learning Blog. Collage: Hamidun News.
◐ Écouter l'article

AWS a lancé le 17 avril 2026 une fonction d'attribution de coûts granulaire pour Amazon Bedrock — suivi détaillé des dépenses d'inférence. Désormais, les dépenses peuvent être automatiquement liées à un utilisateur, une application, un rôle IAM ou un tenant spécifique sans modifier les scénarios d'appel de modèles existants.

Comment ça fonctionne

Bedrock a commencé à envoyer à AWS Billing des données sur quel principal IAM a envoyé une demande au modèle. Cela peut être un utilisateur IAM ordinaire, un rôle d'application, une session fédérée temporaire via Okta ou Entra ID, ainsi qu'une clé API Bedrock si elle est associée à une identité IAM. Le rapport CUR 2.

0 reçoit un nouveau champ line_item_iam_principal et par line_item_usage_type vous pouvez voir quel modèle a été utilisé, dans quelle région et si l'argent est allé aux tokens d'entrée ou de sortie. En plus de cela, AWS offre de connecter des tags d'allocation de coûts. Ils peuvent être attachés directement aux utilisateurs et rôles IAM ou transmis en tant que tags de session lors de l'autorisation fédérée et AssumeRole.

Une fois activés dans la facturation, ces tags apparaissent à la fois dans CUR 2.0 et dans Cost Explorer, où les dépenses peuvent déjà être agrégées par équipe, projet, centre de coûts ou tenant. La fonction elle-même est disponible dans les régions commerciales sans frais supplémentaires, mais elle nécessite l'activation de l'exportation du principal IAM vers CUR 2.

0 et l'attente de l'apparition des tags dans les 24–48 heures.

"Comprendre exactement qui dépense de l'argent pour l'inférence est la

première étape vers la facturation rétroactive, la prévision et l'optimisation."

Quatre scénarios de comptabilisation

AWS décrit quatre schémas typiques où la nouvelle attribution est particulièrement utile. La logique est simple : quiconque appelle Bedrock devient l'unité comptable. Mais la méthode d'étiquetage dépend de si une personne, un service, une session SSO d'entreprise ou une passerelle LLM commune travaille avec les modèles. La différence est importante car elle détermine où seront stockés l'identifiant du tiers appelant et les tags pour l'agrégation ultérieure des coûts dans les rapports et alertes.

  • Utilisateurs IAM et clés API — adapté aux petites équipes et prototypes : vous pouvez voir les dépenses de chaque développeur séparément.
  • Rôles IAM pour les applications — pratique pour les services de production : les dépenses sont divisées par backends, travaux batch et projets.
  • Utilisateurs fédérés via IdP — les utilisateurs d'entreprise sont visibles par nom de session et tags de SAML ou OIDC.
  • Passerelle LLM ou proxy — pour SaaS et plateformes IA internes où vous avez besoin d'une répartition par utilisateurs et tenants, pas une seule ligne pour l'ensemble de la passerelle.

L'option la plus non triviale est la passerelle. Si le proxy accède à Bedrock sous un seul rôle, la facturation ne verra que ce rôle et perdra la granularité. AWS suggère de résoudre cela par AssumeRole pour chaque utilisateur ou tenant avec role-session-name et tags transmis. Les identifiants obtenus peuvent être mis en cache jusqu'à une heure, le modèle ne nécessite donc pas d'appels STS à chaque demande. La limite STS par défaut pour AssumeRole est de 500 appels par seconde par compte, et cela est important à prendre en compte dans les systèmes à haut débit.

Effet pratique pour les équipes

Pour FinOps et les plateformes d'IA, cela comble une lacune de longue date : auparavant, les dépenses de Bedrock n'étaient souvent visibles qu'au niveau du compte ou d'un seul utilisateur de service, et les équipes devaient ensuite construire leur propre couche de journalisation et distribuer les coûts manuellement. Désormais, AWS fournit un mécanisme natif de facturation rétroactive et de facturation interne via les mêmes identités et tags IAM que les entreprises utilisent déjà pour l'accès et la gouvernance. Un avantage supplémentaire est la capacité à comprendre rapidement qui utilise des modèles coûteux comme Opus, qui utilise des configurations plus légères et où le budget est consommé par les tokens de sortie.

Pour les équipes d'ingénierie, la valeur va au-delà des finances. Si chaque microservice a son propre rôle et que les employés ont leur propre session fédérée, le même mécanisme améliore simultanément la sécurité et la transparence. Dans SaaS multi-tenant, c'est particulièrement utile : vous pouvez comparer le coût de service des clients, établir les tarifs internes et définir des alertes dans Cost Explorer par tags.

Essentiellement, AWS transforme l'identité d'appel du modèle en une étiquette financière à part entière qui peut être utilisée pour construire des rapports sans pipeline de données séparé.

Ce que cela signifie

Amazon Bedrock devient notablement plus pratique pour les entreprises qui montent en échelle GenAI non pas sur des dizaines de demandes de démonstration, mais sur de véritables équipes, services et clients. Plus une entreprise a de trafic IA, plus il est important de voir non seulement la facture totale, mais la source spécifique des dépenses.

ZK
Hamidun News
Actualités IA sans bruit. Sélection éditoriale quotidienne de plus de 400 sources. Produit de Zhemal Khamidun, Head of AI chez Alpina Digital.

Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?

AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.

Qu'en pensez-vous ?
Chargement des commentaires…