Cómo Sun Finance y AWS aceleraron la verificación de documentos y redujeron el riesgo de fraude
Sun Finance automatizó la verificación de documentos con Amazon Bedrock, Textract y Rekognition. La empresa elevó la precisión de extracción de datos del…
Procesado por IA desde AWS Machine Learning Blog; editado por Hamidun News
Sun Finance trasladó la verificación de identidad a modo automático usando servicios AWS e IA generativa. La empresa construyó un pipeline que extrae datos de documentos más rápidamente, procesa solicitudes de manera más económica y ayuda a detectar coincidencias sospechosas casi en tiempo real.
Cómo Funciona el Pipeline
La solución se basa en dividir tareas entre múltiples herramientas. Amazon Textract maneja OCR y extrae texto de documentos de identidad, Amazon Bedrock estructura la salida y normaliza campos, y Amazon Rekognition respalda la verificación visual y escenarios antifraude. Este enfoque resultó más práctico que intentar resolver todo con un único modelo: un servicio especializado realiza la extracción, mientras que el LLM se encarga de la interpretación, corrección de formato y ensamblaje de la estructura final para sistemas internos.
La velocidad de la arquitectura es igualmente crítica. Sun Finance construyó un pipeline IDV sin servidor donde el procesamiento se activa por eventos y no requiere infraestructura constante para picos de carga. Esto es especialmente útil para procesos de préstamos y fintech donde el flujo de documentos es inestable: puede ser mínimo por la noche y aumentar bruscamente durante horas de emisión. En este esquema, el control de costos es más fácil, y el tiempo de respuesta no depende de colas manuales de operadores que anteriormente podrían retrasar la verificación durante muchas horas.
- OCR extrae texto y campos brutos del documento
- LLM lleva los datos a una estructura unificada y elimina ruido
- Rekognition añade señales visuales para verificación de identidad
- La búsqueda vectorial ayuda a encontrar aplicaciones suspiciosamente similares
Para antifraude en este esquema, es importante no solo leer el documento sino también compararlo con casos ya procesados. La búsqueda vectorial permite almacenar embeddings de aplicaciones e identificar rápidamente coincidencias cercanas por imagen, texto o combinación de características. Si el sistema detecta documentos demasiado similares, patrones repetidos o proximidad atípica entre diferentes aplicaciones, puede enviarlos para revisión adicional. Esto proporciona una capa de protección más flexible que las reglas rígidas simples.
Por Qué Funcionó
La conclusión clave es que combinar OCR y LLM produce mejores resultados que usar cada componente de forma independiente. Según Sun Finance, la precisión de extracción aumentó de 79,7% a 90,8%. Para tales escenarios, esto no es una mejora cosmética: cada pocos puntos porcentuales de precisión impactan directamente el volumen de retrabajo manual, el número de errores de formulario y la velocidad de toma de decisiones de aplicación.
El LLM aquí no reemplaza el reconocimiento especializado sino que lo complementa: entiende el contexto de campos, alinea nombres, elimina artefatos típicos de OCR y prepara datos para automatización adicional.
El impacto económico es igualmente notable. El costo por procesamiento de documento, según AWS, bajó 91%, y el tiempo de procesamiento se redujo de un máximo de 20 horas a menos de 5 segundos. Para fintech, esto significa varias cosas a la vez: costos operacionales más bajos, menos rechazos debido a largas esperas y una mejor oportunidad de verificar a un cliente antes de que abandone la aplicación.
En paralelo, el sistema antifraude basado en vectores permite buscar aplicaciones repetidas o demasiado similares sin sobrecarga de servidor pesado. Esto hace que la verificación sea no solo más rápida sino también más resistente a intentos de eludir reglas básicas.
Lo Que Esto Significa
El caso Sun Finance muestra que la IA generativa en el procesamiento de documentos funciona mejor no como un reemplazo universal para toda la pila, sino como una capa sobre servicios especializados ya fuertes. Para bancos, MFOs y otras empresas con procesos KYC, esto envía una señal clara: si OCR, estructuración y antifraude se distribuyen adecuadamente entre diferentes componentes, puede mejorar simultáneamente la precisión, reducir el tiempo de respuesta a segundos y disminuir significativamente el costo por verificación.
¿Quieres dejar de leer sobre IA y empezar a usarla?
AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.