Habr AI→ original

Où passe la frontière des capacités de l’AI moderne

La course aux LLM a atteint une dimension internationale : la puissance de calcul nécessaire à l’entraînement des modèles est comparée à des arsenaux…

Traité par IA depuis Habr AI ; édité par Hamidun News
Où passe la frontière des capacités de l’AI moderne
Source : Habr AI. Collage: Hamidun News.
◐ Écouter l'article

La puissance de calcul nécessaire pour entraîner des modèles de langage est aujourd'hui discutée au niveau des chefs d'État, et non seulement dans les conseils d'administration des grandes sociétés technologiques. La course à la domination dans le domaine de l'IA est devenue un facteur géopolitique comparable par son importance au contrôle des technologies nucléaires. Mais derrière ce battage se cache une question fondamentale que l'industrie préfère ignorer : existe-t-il un plafond de principe à ce que l'intelligence artificielle dans sa forme actuelle est capable de faire ?

Pour répondre à cette question, nous devons d'abord clarifier la terminologie. L'inventeur et méthodologue soviétique Genrikh Altshuller, créateur de la Théorie de la solution des problèmes inventifs (TRIZ), a établi une distinction fondamentale entre deux types de tâches. Le premier concerne les tâches routinières.

Elles peuvent être incroyablement complexes d'un point de vue informatique, exiger des téraoctets de données et des mois de travail de superordinateurs, mais leur résolution s'inscrit entièrement dans le système de connaissances existant. Essentiellement, ce sont des tâches de recherche et de combinaison de ce que l'humanité connaît déjà. Et c'est précisément ici que les modèles de langage modernes montrent des résultats impressionnants — ils trient, synthétisent et adaptent les connaissances existantes à une vitesse et une échelle inaccessibles à l'esprit humain.

Le deuxième type concerne les tâches inventives. C'est un domaine où il faut faire plus que simplement trouver une réponse dans l'espace du connu — il faut aller au-delà de ses frontières. Créer une nouvelle abstraction, découvrir un motif que personne n'a auparavant formulé, ou proposer une solution qui contredit les idées reçues. C'est ici que les choses deviennent les plus intéressantes — et les plus troublantes pour ceux qui croient à l'inévitabilité d'une IA « forte ».

Les grands modèles de langage modernes, malgré leurs performances impressionnantes, fonctionnent selon le principe de généralisation statistique de modèles provenant des données d'entraînement. Ils ne « comprennent » pas au sens où les humains comprennent — ils reconnaissent des structures et les reproduisent avec des variations. Cela en fait des outils brillants pour les tâches routinières de toute complexité : de l'écriture de code selon des modèles connus au diagnostic de maladies basé sur des données médicales accumulées.

Mais quand il s'agit d'une véritable découverte — voir ce qui n'est pas dans les données — le modèle fait face à une impasse épistémologique. Il ne peut pas aller au-delà des frontières de l'espace de connaissances sur lequel il a été entraîné.

Bien entendu, on pourrait objecter que les modèles produisent parfois des résultats inattendus et même « créatifs ». C'est vrai, mais une telle « créativité » est combinatoire, pas inventin. Un modèle peut connecter deux domaines de connaissance éloignés de manière non évidente, et le résultat peut ressembler à une illumination. Cependant, les véritables connaissances nouvelles — des connaissances qui ne sont pas une recombinаison de l'existant — requièrent un mécanisme cognitif différent. Quel est exactement ce mécanisme reste une question à laquelle ni les neurosciences ni la philosophie de l'esprit ne peuvent répondre.

Les conséquences pratiques de cette distinction sont énormes. Les entreprises et les gouvernements qui investissent des milliards dans le développement de l'IA doivent évaluer sobrement les tâches auxquelles ils seront confrontés. S'il s'agit d'automatisation, d'optimisation, de mise à l'échelle des processus existants — les modèles de langage y parviendront, et toujours mieux chaque année. Si le pari est que l'IA réalisera une percée scientifique fondamentale ou créera une technologie entièrement nouvelle sans participation humaine — ces attentes sont probablement trop élevées. Du moins avec l'architecture actuelle des modèles.

Il y a aussi un niveau plus profond au problème. La course LLM au niveau inter-étatique crée une illusion dangereuse : celui qui construira en premier le modèle le plus puissant gagnera un avantage stratégique dans tout. Mais s'il existe un plafond épistémologique, augmenter la puissance informatique ne fournit qu'une augmentation quantitative dans la résolution des tâches routinières, pas un saut qualitatif vers une superintelligence machine. Cela ne diminue pas l'importance de l'IA — l'automatisation du travail routinier elle-même transforme l'économie et la société. Mais cela signifie que l'intelligence humaine, capable de véritable invention, reste une ressource irremplaçable.

La question des limites de l'IA n'est pas un jugement sur la technologie, mais une invitation à une conversation honnête sur sa nature. Mieux nous comprenons ce que les machines peuvent et ne peuvent pas faire, plus efficacement nous pourrons construire une symbiose de l'intelligence humaine et de la machine. Et peut-être que cette symbiose — et non la course vers un modèle omnipotent — deviendra la véritable percée de la prochaine décennie.

ZK
Hamidun News
Actualités IA sans bruit. Sélection éditoriale quotidienne de plus de 400 sources. Produit de Zhemal Khamidun, Head of AI chez Alpina Digital.

Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?

AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.

Qu'en pensez-vous ?
Chargement des commentaires…