Jiqizhixin (机器之心)→ original

Google DeepMind remporte l'argent: l'IA résout les problèmes olympiques, mais à quel prix?

Tandis que le monde entier se demande si ChatGPT apprendra un jour à ne plus se tromper sur les recettes de gâteaux, Google DeepMind a décidé de s'attaquer…

Traité par IA depuis Jiqizhixin (机器之心) ; édité par Hamidun News
Google DeepMind remporte l'argent: l'IA résout les problèmes olympiques, mais à quel prix?
Source : Jiqizhixin (机器之心). Collage: Hamidun News.
◐ Écouter l'article

Tandis que le monde entier se demande si ChatGPT apprendra un jour à ne plus se tromper sur les recettes de gâteaux, Google DeepMind a décidé de s'attaquer au sacré : l'Olympiade Internationale de Mathématiques (OIM). Les résultats d'AlphaProof et AlphaGeometry 2 ont fait frémir l'industrie : les systèmes ont résolu quatre problèmes sur six, ce qui correspond au niveau d'un médaillé d'argent. On aurait cru voir le moment de la singularité, quand le silicium a définitivement triomphé du carbone en logique pure.

Mais en regardant les détails de près, le triomphe ressemble davantage à une victoire héroïque face aux circonstances qu'à une promenade de santé. Les mathématiques ont toujours été le talon d'Achille des modèles de langage. Les LLM ordinaires fonctionnent sur des probabilités, en prédisant le mot suivant, ce qui dans le monde rigoureux des preuves conduit à des hallucinations inévitables.

Pour résoudre ce problème, les ingénieurs de DeepMind ont emprunté la voie de l'hybridation. AlphaProof combine la flexibilité de l'apprentissage par renforcement avec la discipline sévère du langage de vérification formelle Lean. Cela permet à l'intelligence artificielle non seulement de deviner la réponse, mais d'écrire du code qui se vérifie à chaque étape logique.

AlphaGeometry 2, de son côté, a reçu une injection puissante sous la forme du modèle Gemini, ce qui lui a permis de résoudre des énigmes géométriques dizaines de fois plus rapidement que son prédécesseur. Cependant, derrière l'éclat de la médaille d'argent se cache une réalité désagréable. Alors que les participants vivants à l'olympiade ont résolu des problèmes lors de deux séances de quatre heures et demie, l'intelligence artificielle a nécessité plusieurs jours de calcul continu pour certaines preuves.

Cela souligne le principal problème des systèmes modernes : ils sont colossalement inefficaces comparés au cerveau humain. Nous voyons un exemple classique de cueillette des fruits faciles. Oui, l'IA a appris à fonctionner dans le cadre rigoureux des langages formels, mais elle gaspille toujours des ressources de calcul colossales là où un adolescent talentueux n'aurait besoin que d'une feuille de papier et de quelques heures de réflexion.

L'écart en matière d'efficacité énergétique entre l'intelligence biologique et l'intelligence numérique reste immense. Pourquoi est-ce important maintenant ? Nous assistons à un changement fondamental dans la stratégie de développement de l'IA.

L'industrie a compris que simplement augmenter l'échelle des données ne produit plus de gains exponentiels de qualité sur les tâches vraiment complexes. L'avenir appartient aux systèmes qui peuvent raisonner et vérifier leurs conclusions. Google crée essentiellement ce qu'on appelle le Système 2 pour l'IA : une pensée lente et délibérée qui complète la pensée rapide et intuitive du Système 1 des chatbots ordinaires.

Cela est critique non seulement pour les mathématiques pures, mais aussi pour la programmation, la cybersécurité et la conception de systèmes d'ingénierie complexes, où une simple erreur d'un bit peut conduire à une catastrophe. Néanmoins, Demis Hassabis et son équipe reconnaissent honnêtement : le processus de formation et de fonctionnement de ces modèles reste difficile. Pour qu'AlphaProof puisse fonctionner, les problèmes doivent être traduits manuellement dans le langage Lean : l'IA ne peut pas encore interpréter indépendamment les conditions des problèmes en langage naturel avec une précision suffisante.

Nous avons acquis un outil puissant qui nécessite toujours une véritable armée d'ingénieurs traducteurs pour fonctionner. Cela rappelle les premiers ordinateurs, qui occupaient des salles entières et nécessitaient des cartes perforées. Le potentiel est énorme, mais il faudra des années avant qu'un mathématicien dans votre poche capable de faire des découvertes en temps réel n'émerge.

L'essentiel : Google DeepMind a prouvé que l'IA peut gérer la logique d'ordre supérieur sans erreurs, mais le prix de cette infaillibilité est toujours exorbitant. L'entreprise parviendra-t-elle à accélérer radicalement la réflexion de ses systèmes d'ici la fin de l'année ?

ZK
Hamidun News
Actualités IA sans bruit. Sélection éditoriale quotidienne de plus de 400 sources. Produit de Zhemal Khamidun, Head of AI chez Alpina Digital.

Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?

AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.

Qu'en pensez-vous ?
Chargement des commentaires…