Como a Sun Finance e a AWS aceleraram a verificação de documentos e reduziram o risco de fraude
A Sun Finance automatizou a verificação de documentos com Amazon Bedrock, Textract e Rekognition. A empresa elevou a precisão da extração de dados de 79,7%…
Processado por IA de AWS Machine Learning Blog; editado por Hamidun News
Sun Finance moveu a verificação de identidade para modo automático usando serviços AWS e IA generativa. A empresa construiu um pipeline que extrai dados de documentos mais rapidamente, processa aplicações de forma mais barata e ajuda a detectar correspondências suspeitas quase em tempo real.
Como o Pipeline Funciona
A solução é construída dividindo tarefas entre múltiplas ferramentas. Amazon Textract lida com OCR e extrai texto de documentos de identidade, Amazon Bedrock estrutura a saída e normaliza campos, e Amazon Rekognition suporta verificação visual e cenários antifraude. Essa abordagem provou ser mais prática do que tentar resolver tudo com um único modelo: um serviço especializado executa a extração, enquanto o LLM assume a interpretação, correção de formato e montagem da estrutura final para sistemas internos.
A velocidade da arquitetura é igualmente crítica. Sun Finance construiu um pipeline IDV sem servidor onde o processamento é acionado por eventos e não requer infraestrutura constante para picos de carga. Isso é especialmente útil para processos de empréstimos e fintech onde o fluxo de documentos é instável: pode ser mínimo à noite e aumentar drasticamente durante horas de emissão. Neste esquema, o controle de custos é mais fácil, e o tempo de resposta não depende de filas manuais de operadores que anteriormente poderiam atrasar a verificação por muitas horas.
- OCR extrai texto e campos brutos do documento
- LLM traz dados para uma estrutura unificada e remove ruído
- Rekognition adiciona sinais visuais para verificação de identidade
- A busca vetorial ajuda a encontrar aplicações suspeitosamente semelhantes
Para antifraude neste esquema, é importante não apenas ler o documento, mas também compará-lo com casos já processados. A busca vetorial permite armazenar embeddings de aplicações e encontrar rapidamente correspondências próximas por imagem, texto ou combinação de características. Se o sistema detectar documentos muito semelhantes, padrões repetidos ou proximidade atípica entre diferentes aplicações, pode enviá-los para revisão adicional. Isso fornece uma camada de proteção mais flexível do que regras rígidas simples.
Por Que Funcionou
A conclusão chave é que a combinação de OCR e LLM produz melhores resultados do que usar cada componente independentemente. De acordo com Sun Finance, a precisão de extração aumentou de 79,7% para 90,8%. Para tais cenários, isso não é uma melhoria cosmética: cada alguns pontos percentuais de precisão impactam diretamente o volume de retrabalhação manual, o número de erros de formulário e a velocidade da tomada de decisão de aplicação.
O LLM aqui não substitui o reconhecimento especializado, mas o complementa: entende o contexto do campo, alinha nomes, elimina artefatos típicos de OCR e prepara dados para automação adicional.
O impacto econômico é igualmente notável. O custo por processamento de documento, de acordo com AWS, caiu 91%, e o tempo de processamento caiu de um máximo de 20 horas para menos de 5 segundos. Para fintech, isso significa várias coisas de uma vez: custos operacionais mais baixos, menos rejeições devido a longas esperas e uma chance melhor de verificar um cliente antes que ele abandone a aplicação.
Em paralelo, o sistema antifraude baseado em vetor permite pesquisar aplicações repetidas ou muito semelhantes sem sobrecarga de servidor pesado. Isso torna a verificação não apenas mais rápida, mas também mais resistente a tentativas de contornar regras básicas.
O Que Isso Significa
O caso Sun Finance mostra que a IA generativa no processamento de documentos funciona melhor não como uma substituição universal para toda a pilha, mas como uma camada sobre serviços especializados já fortes. Para bancos, MFOs e outras empresas com processos KYC, isso envia um sinal claro: se OCR, estruturação e antifraude forem adequadamente distribuídos entre diferentes componentes, você pode melhorar simultaneamente a precisão, reduzir o tempo de resposta para segundos e diminuir significativamente o custo por verificação.
Quer parar de ler sobre IA e começar a usar?
AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.