MIT Lance MathNet — La Plus Grande Collection de Problèmes d'Olympiades Mathématiques du Monde
MIT lance MathNet — la plus grande collection ouverte de problèmes d'olympiades mathématiques du monde. Elle comprend plus de 30 000 problèmes et solutions…
Traité par IA depuis MIT News ; édité par Hamidun News
Le MIT a ouvert MathNet — la plus grande collection ouverte de problèmes des Olympiades mathématiques à ce jour, qui est simultanément nécessaire pour les chercheurs en IA et les élèves se préparant à des compétitions. La base de données comprend plus de 30 000 problèmes et solutions détaillées provenant des Olympiades nationales de mathématiques de 47 pays. Pour l'industrie, c'est un test plus rigoureux du raisonnement mathématique que les repères conventionnels en langue anglaise.
Pour les étudiants — une bibliothèque unifiée de problèmes de haute qualité qui étaient auparavant dispersés dans des collections papier, des forums et des archives personnelles. Le projet a été créé par des chercheurs du MIT CSAIL, KAUST et de l'entreprise HUMAIN. Selon l'équipe, MathNet couvre 17 langues, 143 compétitions et environ quatre décennies de mathématiques olympiades.
Les auteurs ont dû collecter 1 595 volumes PDF d'un total de plus de 25 000 pages : des documents numériques modernes aux anciens scans qui n'existaient que dans les collections personnelles pendant des années. Une partie substantielle de l'archive provenait de la collection privée de l'un des coauteurs, qui numérisait manuellement les compilations des Olympiades depuis 2006. L'ensemble de données résultant, selon le MIT, est environ cinq fois plus grand que l'analogue le plus proche, a déjà été mis à disposition publique et sera présenté à la conférence ICLR 2026 au Brésil.
La différence clé de MathNet réside non seulement dans l'échelle, mais aussi dans la qualité des sources. Alors que de nombreux ensembles de données mathématiques existants ont été collectés à partir de forums comme Art of Problem Solving, ici les problèmes sont tirés uniquement des compilations nationales officielles. C'est important car les solutions dans de tels matériaux sont généralement écrites par des experts, elles subissent une vérification et explorent souvent plusieurs méthodes de résolution différentes pour un même problème.
De plus, la collection est beaucoup plus large géographiquement : elle couvre six continents, comprend des problèmes textuels et visuels et ne se limite pas aux traditions anglophone et chinoise. Pour une validation supplémentaire, l'équipe a réuni un groupe de plus de 30 examinateurs de différents pays qui ont conjointement réexaminé des milliers de solutions. Pour les chercheurs, c'est l'occasion d'entraîner des modèles sur une culture mathématique plus diversifiée, plutôt que sur un ensemble restreint de formulations familières.
En tant que repère pour l'IA, MathNet produit des résultats plutôt inconfortables, même pour les modèles puissants. Sur l'ensemble principal de 6 400 problèmes, GPT-5 a montré environ 69,3%, ce qui signifie qu'il n'a pas résolu presque un tiers des problèmes de niveau olympiades. Lorsque le problème contient des illustrations, les résultats des modèles chutent encore plus notablement, ce qui indique une faiblesse persistante du raisonnement visuel.
L'équipe a également testé la performance des modèles sur les langues moins courantes : plusieurs systèmes open-source ont obtenu 0% sur les problèmes en mongol. Séparément, les chercheurs ont ajouté un benchmark de récupération, où il faut reconnaître la similarité structurelle entre deux problèmes. Même les meilleurs modèles d'embedding ont trouvé la correspondance correcte au premier essai dans seulement environ 5% des cas.
C'est important non seulement pour l'IA, mais aussi pour les Olympiades elles-mêmes : des problèmes similaires en essence sont déjà apparus aux examens réels, et tracer les équivalents mathématiques à travers différentes langues, notations et formats est extrêmement difficile même pour les experts. Un autre test a montré que la génération augmentée par récupération aide effectivement, mais seulement si le problème suggéré est vraiment proche en structure : pour DeepSeek-V3.2-Speciale, l'amélioration a atteint jusqu'à 12 points de pourcentage, tandis que les suggestions non pertinentes ont aggravé le résultat dans environ 22% des cas.
L'importance pratique de MathNet s'étend au-delà de l'IA académique. Pour les élèves et les enseignants, c'est un cas rare où des matériaux des Olympiades de haute qualité provenant de dizaines de pays sont réunis en un seul endroit et mis en format unifié. Pour les développeurs de modèles, c'est un rappel que les affirmations audacieuses concernant les mathématiques « presque résolues » sont prématurées : dès que les problèmes deviennent véritablement internationaux, multimodaux et moins standardisés, l'écart de qualité est toujours clairement visible.
C'est pourquoi MathNet pourrait devenir l'un des tests les plus utiles pour la véritable pensée mathématique des modèles dans les années à venir et simultanément l'une des bibliothèques ouvertes les plus précieuses pour se préparer aux Olympiades mathématiques.
Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?
AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.