Comment Sun Finance et AWS ont accéléré la vérification des documents et réduit le risque de fraude
Sun Finance a automatisé la vérification des documents avec Amazon Bedrock, Textract et Rekognition. L'entreprise a fait passer la précision de l'extraction…
Traité par IA depuis AWS Machine Learning Blog ; édité par Hamidun News
Sun Finance a transitionné la vérification d'identité en mode automatisé en utilisant les services AWS et l'IA générative. L'entreprise a construit un pipeline qui extrait les données des documents plus rapidement, traite les demandes à moindre coût et aide à détecter les correspondances suspectes en quasi-temps réel.
Architecture du Pipeline
La solution repose sur la division des tâches entre plusieurs outils. Amazon Textract gère la reconnaissance optique de caractères (OCR) et extrait le texte des documents d'identité, Amazon Bedrock structure le résultat et normalise les champs, tandis que Amazon Rekognition prend en charge la vérification visuelle et les scénarios anti-fraude. Cette approche s'est avérée plus pratique que de tenter de résoudre tout avec un seul modèle : un service spécialisé effectue l'extraction, tandis que le LLM prend en charge l'interprétation, la correction du format et l'assemblage de la structure finale pour les systèmes internes.
La vitesse de l'architecture est tout aussi critique. Sun Finance a construit un pipeline IDV sans serveur où le traitement est déclenché par des événements et ne nécessite pas d'infrastructure constante pour les pics de charge. Ceci est particulièrement utile pour les processus de prêt et fintech où le flux de documents est instable : il peut être minimal la nuit et augmenter fortement pendant les heures d'émission. Dans ce schéma, le contrôle des coûts est plus facile, et le temps de réponse ne dépend pas des files d'attente manuelles d'opérateurs qui pouvaient auparavant retarder la vérification pendant de nombreuses heures.
- OCR extrait le texte brut et les champs du document
- Le LLM porte les données dans une structure unifiée et supprime le bruit
- Rekognition ajoute des signaux visuels pour la vérification d'identité
- La recherche vectorielle aide à trouver les demandes suspectes similaires
Pour la prévention de la fraude dans ce schéma, il est important non seulement de lire le document mais aussi de le comparer avec les cas déjà traités. La recherche vectorielle permet de stocker les embeddings des demandes et de trouver rapidement des correspondances proches par image, texte ou combinaison de caractéristiques. Si le système détecte des documents trop similaires, des motifs répétitifs ou une proximité atypique entre différentes demandes, il peut les envoyer pour examen supplémentaire. Cela offre une couche de protection plus flexible que les simples règles rigides.
Pourquoi Cela a Fonctionné
La conclusion clé est que la combinaison d'OCR et de LLM produit de meilleurs résultats que l'utilisation indépendante de chaque composant. Selon Sun Finance, la précision d'extraction a augmenté de 79,7% à 90,8%. Pour de tels scénarios, ce n'est pas une amélioration cosmétique : chaque quelques points de pourcentage de précision impactent directement le volume de retouches manuelles, le nombre d'erreurs de formulaire et la vitesse des décisions d'application.
Le LLM ici ne remplace pas la reconnaissance spécialisée mais la complète : il comprend le contexte des champs, aligne les noms, élimine les artefacts typiques d'OCR et prépare les données pour une automatisation supplémentaire.
L'impact économique est tout aussi notable. Le coût par traitement de document, selon AWS, a diminué de 91%, et le temps de traitement a chuté d'un maximum de 20 heures à moins de 5 secondes. Pour la fintech, cela signifie plusieurs choses à la fois : des coûts d'exploitation plus faibles, moins de rejets dus aux longues attentes, et une meilleure chance de vérifier un client avant qu'il abandonne la demande.
En parallèle, le système anti-fraude basé sur les vecteurs permet de rechercher des demandes répétées ou trop similaires sans surcharge de serveur importante. Cela rend la vérification non seulement plus rapide mais aussi plus résistante aux tentatives de contourner les règles de base.
Ce Que Cela Signifie
Le cas Sun Finance montre que l'IA générative dans le traitement des documents fonctionne mieux non pas comme un remplacement universel de l'ensemble de la pile, mais comme une couche au-dessus de services spécialisés déjà puissants. Pour les banques, les MFOs et autres entreprises avec des processus KYC, cela envoie un signal clair : si OCR, structuration et anti-fraude sont correctement distribués entre différents composants, vous pouvez simultanément améliorer la précision, réduire le temps de traitement à quelques secondes et réduire considérablement le coût par vérification.
Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?
AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.