Claude Code et le test de Kolmogorov-Smirnov ont détecté des anomalies dans une olympiade pour enfants
Une connaissance a demandé à un expert antifraude d'examiner les résultats d'une olympiade pour enfants : les scores semblaient étranges. L'expert a appliqué…
Traité par IA depuis Habr AI ; édité par Hamidun News
Un expert en anti-fraude a reçu une demande inattendue d'une connaissance : vérifier les résultats d'une olympiade enfantine où participait son fils. Les scores semblaient « bizarres » — et le spécialiste s'est mis au travail, armé de Claude Code et du test classique de Kolmogorov-Smirnov.
L'anti-fraude au-delà des banques
Dans le secteur bancaire, les méthodes statistiques fonctionnent depuis des années : analyse des transactions, recherche de motifs anormaux, vérification des distributions. Les mêmes outils s'appliquent partout où il y a des données et une incitation potentielle à la manipulation — qu'il s'agisse d'opérations financières ou de notes scolaires. La connaissance est venue avec une demande simple : « quelque chose dans les résultats semble étrange ». L'expert ne s'est pas limité à l'intuition. La tâche a été formalisée : il existe un ensemble de scores des participants, il existe une distribution honnête attendue — il faut vérifier statistiquement s'ils coïncident. C'est exactement la question que les systèmes anti-fraude posent chaque jour, juste avec des données d'entrée différentes.
Pourquoi le test KS
Le test de Kolmogorov-Smirnov est l'un des outils non paramétriques les plus puissants pour comparer deux distributions. Il n'a pas besoin d'être entraîné sur les données, il ne nécessite pas d'hypothèses sur la normalité. Il suffit de poser la question : « Ces données auraient-elles pu être générées par le même processus aléatoire ?
» — et le test donne une réponse sous la forme d'une p-value. Pour les scores d'olympiade, la logique est simple : si les participants ont résolu les problèmes honnêtement, les résultats se distribueront selon la répartition réelle des connaissances. Une distribution trop « correcte », trop uniforme ou anormalement asymétrique — un signal d'alerte statistique.
Claude Code s'est chargé du codage routinier à chaque étape de l'analyse : Chargement et normalisation des données en Python Calcul de la statistique KS via scipy.stats Visualisation : histogrammes, graphiques Q-Q, courbes CDF Analyse des clusters de réponses identiques entre différents participants * Interprétation de la p-value et formulation des conclusions en langage clair ## Ce qui a été trouvé dans les données La distribution des scores sur une série de problèmes semblait suspecte. Dans une olympiade juste, la dispersion des résultats reflète les différences réelles de préparation : les participants forts résolvent les problèmes difficiles, les faibles ne le font pas.
Cela génère une « queue » caractéristique dans la distribution. Le test KS a enregistré un écart statistiquement significatif : la p-value s'est avérée inférieure au niveau seuil. Des clusters de réponses identiques parmi différents participants et une distribution trop uniforme des scores corrects entre les problèmes — tout cela s'ajoute à un tableau que les statistiques rejettent comme aléatoire.
« Trois cents roubles pour un importé — c'est une réclamation sérieuse.
Eh bien, trois cents alors. Allons-y, » — écrit l'auteur, soulignant : les outils professionnels s'activent automatiquement, indépendamment de l'ampleur de la tâche.
Claude
Code comme coauteur de l'analyse La valeur particulière de cette histoire est de démontrer le flux de travail. L'expert n'a pas demandé au modèle de « vérifier l'olympiade » — il a mené un dialogue structuré : a formulé une hypothèse, reçu du code prêt, l'a exécuté, interprété le résultat, corrigé l'approche et continué. L'expert n'a pas écrit le code à partir de zéro — il a défini la direction : quelle métrique calculer, comment visualiser, ce que signifie le résultat.
Claude Code s'est chargé des détails syntaxiques et de la routine, libérant l'espace mental pour l'interprétation et la prise de décision. Pour un projet analytique ponctuel — exactement comme vérifier une olympiade à la demande d'une connaissance — ceci est particulièrement précieux : au lieu de jours de travail, vous obtenez quelques heures.
Ce que cela signifie
Les méthodes statistiques anti-fraude ont depuis longtemps dépassé le secteur financier. Olympiades scolaires, compétitions, appels d'offres, sondages d'opinion — partout où il y a des données et une motivation pour la manipulation, les mêmes outils fonctionnent. Claude Code abaisse la barrière à l'entrée : pour une analyse statistique sérieuse, vous n'avez plus besoin d'être un programmeur — vous avez juste besoin de comprendre la tâche et de poser les bonnes questions.
Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?
AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.