PwC et AWS présentent un système d'IA pour l'analyse de contrats avec réduction de la vérification jusqu'à 90%
PwC et AWS ont présenté AIDA — une plateforme d'analyse de contrats basée sur Amazon Bedrock. Elle extrait les données structurées des contrats selon des…
Traité par IA depuis AWS Machine Learning Blog ; édité par Hamidun News
PwC et AWS ont présenté AIDA — un système pour l'analyse de contrats qui transforme de longs contrats non structurés en données structurées et réponses en langage naturel. La plateforme est construite sur AWS et utilise Amazon Bedrock pour trouver des termes clés, des délais et des obligations sans recherche manuelle à travers des dizaines de pages.
Comment Fonctionne AIDA
AIDA est conçu pour les avocats, les équipes de conformité et les achats — des domaines où le volume de contrats croît plus vite que les ressources pour les lire. Au lieu de la recherche traditionnelle par mots-clés, le système combine OCR, des règles d'extraction personnalisées et des modèles LLM dans Amazon Bedrock. L'équipe reçoit non seulement des phrases trouvées, mais des champs structurés liés à des fragments spécifiques du contrat. Cela supprime une partie de la charge manuelle des équipes qui collectent généralement ces données manuellement pour la réconciliation, la comptabilité et la déclaration.
Dans une démonstration, PwC a téléchargé des exemples du jeu de données juridique ouvert CUAD dans le système. AIDA construit ensuite une représentation sémantique des documents, les indexe et utilise la Retrieval-Augmented Generation pour répondre à des questions basées sur le texte du contrat. Ceci est important pour les scénarios juridiques : la réponse peut être vérifiée par une référence au paragraphe original, plutôt que de faire confiance au modèle lorsqu'il s'agit de délais, de pénalités ou d'obligations des parties.
Trois Modes Clés
L'idée principale derrière AIDA n'est pas une interface unique pour discuter avec un PDF, mais plusieurs modes pour différentes étapes de l'analyse de contrats. AWS met en avant trois scénarios de base qui offrent les plus grands gains de temps :
- Extraction basée sur un modèle — l'équipe définit les champs une seule fois, comme la date de résiliation, les conditions de renouvellement ou les droits d'utilisation, puis applique les mêmes règles à des milliers de contrats.
- Conversation sur un seul document — vous pouvez poser au système une question sur une date, une obligation ou une restriction spécifique et obtenir une réponse liée à l'emplacement nécessaire dans le texte.
- Conversation globale du projet — AIDA compare plusieurs contrats à la fois, recherche des clauses communes, des différences dans les obligations et consolide les conclusions en une seule réponse.
- Filtrage par métadonnées — les résultats peuvent être réduits par type de contrat, date, unité commerciale ou juridiction pour éviter de mélanger différentes classes de documents.
Selon PwC, dans les déploiements clients, AIDA a réduit le temps d'examen manuel des contrats de jusqu'à 90 %. AWS cite également l'exemple d'un grand studio cinématographique et télévisé où le système a de même accéléré la recherche de droits de licence : il identifie les droits de diffusion, streaming, théâtraux et dérivés pour comprendre rapidement ce qui peut être montré, reconditionné ou lancé sur de nouveaux marchés. Pour les médias et le divertissement, c'est particulièrement important, car le coût d'une erreur de droits est généralement plus élevé que le coût de l'automatisation elle-même.
Sécurité et Intégrations Système
L'architecture d'AIDA est construite comme un service d'entreprise, et non comme un prototype expérimental. Elle dispose d'AWS WAF, d'un équilibreur de charge et d'NGINX à l'entrée, l'accès est géré via Amazon Cognito avec intégration à Microsoft Entra ID ou Okta, et les permissions peuvent être configurées au niveau de l'application et au niveau du projet. Les données sont chiffrées en transit et au repos : les documents et extractions OCR sont stockés dans Amazon S3, les résultats structurés dans Amazon RDS.
Pour traiter de grands volumes, le système utilise Amazon ECS sur AWS Fargate et les files d'attente Amazon SQS, ce qui signifie que le chargement de centaines et de milliers de documents ne bloque pas l'interface. La recherche vectorielle est construite sur Amazon Bedrock Knowledge Bases et Amazon OpenSearch Serverless, et les Guardrails dans Amazon Bedrock gèrent le filtrage du contenu, la protection des données personnelles et la sécurité des prompts. Avant d'envoyer les résultats aux systèmes aval, AIDA peut inclure une vérification human-in-the-loop, et les données elles-mêmes sont transmises à CLM, ERP, CRM et aux référentiels via Lambda, EventBridge et SQS.
Ce Que Cela Signifie
PwC et AWS montrent comment GenAI passe des démonstrations aux processus étroits et coûteux pour l'entreprise. Si le système extrait véritablement et régulièrement des champs, répond avec des citations et s'intègre à CLM ou ERP, alors l'IA juridique commence à s'autofinancer non par des promesses, mais par une économie concrète : cycles d'examen plus courts, moins de travail manuel, identification plus rapide des risques et clarté sur les délais et les obligations dans les contrats.
Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?
AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.