Vanguard a construit un Analyste Virtuel sur AWS en suivant huit principes de données AI-ready
Vanguard, qui gère plus de 9 milliards de dollars d'actifs, a lancé un Analyste Virtuel interne basé sur AWS. La solution a été construite sur les données…
Traité par IA depuis AWS Machine Learning Blog ; édité par Hamidun News
D'abord les Données, puis les Modèles
La conclusion clé de l'expérience de Vanguard : la transformation de l'IA ne commence pas par le choix d'un réseau de neurones ou l'achat de puissance de calcul, mais par la mise en ordre des données. Les ingénieurs de l'entreprise ont formulé huit principes de données prêtes pour l'IA qui ont constitué la base de l'ensemble du projet avant que la première ligne de code du modèle ne soit écrite. Les principes couvrent l'ensemble du cycle de vie — de la sémantique et de la structure à la sécurité et à la surveillance :
- Taxonomie unifiée — vocabulaire commun pour toutes les métriques, KPIs et entités métier, de sorte que « rendement » dans une division signifie la même chose que dans une autre
- Traçabilité des données — possibilité de suivre chaque métrique de la source primaire à l'entrepôt analytique
- Opportunité — garantie de l'actualisation des données au moment de chaque requête
- Métadonnées lisibles par machine — schémas et descriptions compris non seulement par les humains, mais aussi par l'automatisation
- Contrôle d'accès — politiques de sécurité granulaires au niveau des lignes et des colonnes
- Surveillance de la qualité — validation automatique de l'exactitude des données en temps réel
- Formats standardisés — schémas et conventions uniformes adoptés par toutes les équipes
- Documentation — reproductibilité de chaque ensemble de données et explicabilité de chaque calcul
Sans ces principes, les modèles d'IA hallucinent sur des données incorrectes ou ambiguës. Vanguard a résolu le problème de manière systématique plutôt que ponctuelle — et cela est devenu le fondement de leur succès.
AWS Sous le Capot
Pour l'implémentation technique, Vanguard a déployé une suite intégrée de services AWS. Amazon S3 sert de lac de données unique consolidant les sources de différentes divisions. AWS Glue Data Catalog gère les pipelines ETL et le stockage centralisé des métadonnées — c'est là que vivent les descriptions, schémas et définitions métier de tous les ensembles de données.
L'entraînement et le déploiement des modèles sont implémentés sur Amazon SageMaker. L'orchestration de processus complexes à plusieurs étapes est gérée via AWS Step Functions, et la surveillance de la qualité des données et des performances des pipelines est effectuée via Amazon CloudWatch avec des alertes et des tableaux de bord configurés pour l'équipe. En haut de cette infrastructure se trouve l'Analyste Virtuel : il reçoit des questions en langage naturel, les traduit en requêtes de données et retourne des analyses structurées avec des graphiques et des interprétations textuelles.
Les équipes métier obtiennent des insights sans SQL, Python ou files d'attente de demandes à des spécialistes des données.
Résultats pour l'Entreprise
«
Le chemin vers des données prêtes pour l'IA n'est pas un projet ponctuel, mais une culture opérationnelle », soulignent les auteurs du cas dans le blog AWS Machine Learning.
Vanguard documente un impact concret et mesurable. Le temps nécessaire pour préparer les rapports analytiques typiques a été réduit de façon spectaculaire. Les équipes de gestion de portefeuille et d'analyse des risques posent des questions directement au système — au lieu d'assigner des tâches aux analystes de données et d'attendre les réponses pendant des heures ou des jours. Il est important de noter que l'Analyste Virtuel ne remplace pas l'expertise humaine : il prend en charge la partie routinière du travail — agrégation, filtrage et interprétation initiale des données — et libère les analystes pour des tâches de plus haut niveau : développement d'hypothèses et prise de décisions stratégiques.
Ce Que Cela Signifie
Le cas de Vanguard est l'une des descriptions publiques les plus détaillées de la façon dont une grande société financière construit l'analyse de l'IA en production. Huit principes de données prêtes pour l'IA — une liste de contrôle pratique pour toute organisation qui souhaite obtenir une véritable valeur commerciale de l'IA, et non pas un beau pilote sur des données de test parfaitement préparées.
Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?
AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.