Epoch AI: 14 tâches que personne n'a résolu (pour le moment)
Vous souvenez-vous de ces temps glorieux où nous plaisantions sur les réseaux de neurones qui ne pouvaient pas additionner deux nombres à trois chiffres sans…
Traité par IA depuis Habr AI ; édité par Hamidun News
Vous souvenez-vous de ces temps glorieux où nous plaisantions sur les réseaux de neurones qui ne pouvaient pas additionner deux nombres à trois chiffres sans halluciner ? Ces temps sont officiellement révolus. Nous avons rapidement fait la transition de l'époque du « regardez comme c'est drôle que le robot écrive de la poésie » à l'époque du « regardez comment l'algorithme essaie de casser le fondement de l'univers ».
Encore à la mi-2024, GPT-4 trébuchait sur les problèmes de niveau lycée, mais d'ici la fin de 2025, les nouveaux modèles ont commencé à craquer les problèmes des olympiades comme des noix. Or les olympiades sont toujours des problèmes avec des réponses connues. Les chercheurs d'Epoch AI ont décidé qu'il était temps d'arrêter de donner des antisèches aux réseaux de neurones et ont lancé FrontierMath.
C'est une liste de 14 problèmes que personne sur la planète n'a résolus.
L'essence du projet FrontierMath est de tester la capacité de l'IA à générer des connaissances fondamentalement nouvelles. Ce ne sont pas des exercices de manuels scolaires qu'on peut trouver dans les ensembles de données d'entraînement. Chacun de ces quatorze problèmes a été formulé par un chercheur scientifique actif, chacun a été tenté par au moins deux professionnels de haut niveau, et chacun mérite d'être publié dans une revue scientifique de premier plan. Il n'y a pas d'indices sur internet et pas d'algorithmes prêts à l'emploi. Ce sont des « taches blanches » sur la carte des mathématiques modernes qui ont été ignorées pendant des décennies ou simplement n'ont pas pu être surmontées par les esprits humains.
Plongeons dans les détails pour comprendre l'ampleur du défi. L'un des problèmes concerne le groupe de Mathieu M23. Les mathématiciens adorent les symétries, mais les groupes sporadiques sont de tels « monstres mathématiques » qui ne rentrent dans aucune série générale.
Pour la plupart d'entre eux, les scientifiques ont déjà trouvé des polynômes avec les groupes de Galois correspondants, mais M23 reste le dernier bastion, une lacune dans la recherche qui se poursuit depuis de nombreuses années. Trouver ce polynôme signifierait fermer un chapitre entier de l'algèbre. Un autre problème ne semble plus simple qu'à première vue : vous devez créer un algorithme qui détermine si un nœud peut être dénoué en un seul mouvement.
Les topologues appellent cela « le nombre de dénouement égal à un ». C'est une question fondamentale en topologie de basse dimension qui n'a toujours pas de réponse claire.
Pourquoi est-ce important maintenant ? L'industrie de l'IA a atteint un point où simplement augmenter la quantité de données ne produit plus une croissance explosive de la qualité. Nous avons entraîné des modèles à imiter la parole humaine et à compiler les connaissances existantes, mais nous attendons toujours le moment où un réseau de neurones fait une découverte scientifique.
Si un modèle résout ne serait-ce que l'un de ces problèmes, ce ne sera pas simplement une « réussite technologique ». Ce sera un résultat scientifique complet qui figurera dans une revue évaluée par les pairs non pas à cause du battage autour de l'IA, mais en raison de la valeur de la solution elle-même. Nous parlons de transformer l'IA d'un moteur de recherche avancé en un collègue chercheur à part entière.
Le lien avec les événements antérieurs est clairement traçable ici. Après que les modèles ont commencé à remporter massivement des tests comme MATH ou GSM8K, il est devenu clair que nous avons besoin de nouveaux outils de mesure. FrontierMath est une tentative de sentir la limite où la mémoire s'arrête et l'intelligence commence. C'est un défi non seulement pour OpenAI ou Anthropic, mais pour tout le concept de mise à l'échelle. Maintenant, ce n'est pas suffisant d'avoir le plus grand cluster GPU ; vous avez besoin d'un algorithme capable d'un raisonnement logique profond dans des conditions d'incertitude totale. C'est un test d'endurance pour toutes les promesses concernant « l'IA forte » ou AGI.
Qu'est-ce que cela signifie pour nous ? Nous sommes au seuil d'une situation où l'IA pourrait devenir la clé pour résoudre des problèmes en science des matériaux, en cryptographie ou en physique quantique via les mathématiques. Si un réseau de neurones réussit avec la topologie des nœuds ou les groupes de Mathieu, il pourra concevoir de nouvelles molécules ou optimiser les chaînes d'approvisionnement à un niveau inaccessible aux humains. Cela signifierait que nous avons finalement obtenu un outil plus intelligent que nous dans les domaines abstraits les plus complexes. Et l'ironie ici est que nous pourrions ne pas comprendre immédiatement exactement comment l'IA est arrivée à la solution, mais le résultat changera notre réalité physique.
Le point clé : FrontierMath est le boss final pour la génération actuelle de réseaux de neurones. Quelque chose comme GPT-5 ou Claude 4 pourra-t-il franchir cette barrière, ou devrons-nous attendre des architectures fondamentalement nouvelles ?
Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?
AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.