Claude Code e o teste Kolmogorov-Smirnov detectaram anomalias em uma olimpíada infantil
Um conhecido pediu a um especialista em antifraude que olhasse os resultados de uma olimpíada infantil: as pontuações pareciam estranhas. O especialista…
Processado por IA de Habr AI; editado por Hamidun News
Um especialista em antifraude recebeu um pedido inesperado de um conhecido: verificar os resultados de uma olimpíada infantil onde participava seu filho. Os scores pareciam "estranhos" — e o especialista se pôs à obra, armado com Claude Code e o clássico teste de Kolmogorov-Smirnov.
Antifraude vai além dos bancos
No setor bancário, métodos estatísticos funcionam há anos: análise de transações, busca por padrões anômalos, verificação de distribuições. As mesmas ferramentas se aplicam em qualquer lugar onde haja dados e um potencial incentivo para manipulação — seja operações financeiras ou notas escolares. O conhecido veio com um pedido simples: "algo está estranho nos resultados". O especialista não se limitou à intuição. A tarefa foi formalizada: há um conjunto de scores dos participantes, há uma distribuição honesta esperada — é preciso verificar estatisticamente se coincidem. Esta é exatamente a pergunta que sistemas antifraude fazem todos os dias, apenas com dados de entrada diferentes.
Por que o teste KS O teste de
Kolmogorov-Smirnov é uma das ferramentas não-paramétricas mais poderosas para comparar duas distribuições. Não precisa ser treinado nos dados, não requer pressupostos sobre normalidade. É suficiente fazer a pergunta: "Poderiam esses dados ter sido gerados pelo mesmo processo aleatório?"
— e o teste dá a resposta na forma de um p-value. Para scores de olimpíada, a lógica é simples: se os participantes resolveram os problemas honestamente, os resultados se distribuirão de acordo com a dispersão real do conhecimento. Uma distribuição muito "correta", muito uniforme ou anomalamente desviada — um sinal estatístico de alerta.
Claude Code assumiu a codificação rotineira em cada etapa da análise: Carregamento e normalização de dados em Python Cálculo da estatística KS via scipy.stats Visualização: histogramas, gráficos Q-Q, curvas CDF Análise de clusters de respostas idênticas entre diferentes participantes * Interpretação do p-value e formulação de conclusões em linguagem clara ## O que foi encontrado nos dados A distribuição de scores em uma série de problemas parecia suspeita. Em uma olimpíada justa, a dispersão de resultados reflete diferenças reais na preparação: participantes fortes resolvem problemas difíceis, fracos não.
Isso gera uma "cauda" característica na distribuição. O teste KS registrou um desvio estatisticamente significativo: o p-value ficou abaixo do nível de limiar. Clusters de respostas idênticas entre diferentes participantes e uma distribuição muito uniforme de scores corretos entre os problemas — tudo isso se soma em um quadro que a estatística rejeita como aleatório.
"Trezentos reais por um importado — é uma reclamação séria.
Bem, trezentos então. Vamos lá," — escreve o autor, enfatizando: ferramentas profissionais ativam automaticamente, independentemente da escala da tarefa.
Claude
Code como coautor da análise O valor especial desta história é demonstrar o fluxo de trabalho. O especialista não pediu ao modelo para "verificar a olimpíada" — ele conduziu um diálogo estruturado: formulou uma hipótese, recebeu código pronto, executou, interpretou o resultado, corrigiu a abordagem e continuou adiante. O especialista não escreveu código do zero — ele definiu a direção: qual métrica calcular, como visualizar, o que o resultado significa. Claude Code lidou com detalhes sintáticos e rotina, liberando espaço mental para interpretação e tomada de decisão. Para um projeto analítico único — exatamente como verificar uma olimpíada a pedido de um conhecido — isto é especialmente valioso: em vez de dias de trabalho, você consegue algumas horas.
O que isto significa Métodos estatísticos de antifraude há muito ultrapassaram o setor financeiro.
Olimpíadas escolares, competições, licitações, pesquisas de opinião — em qualquer lugar onde haja dados e motivo para manipulação, as mesmas ferramentas funcionam. Claude Code reduz a barreira de entrada: para análise estatística séria, você não precisa mais ser programador — basta entender a tarefa e formular as perguntas corretas.
Quer parar de ler sobre IA e começar a usar?
AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.