Science Daily AI→ original

Centaur connaissait les réponses, mais ne comprenait pas les questions : la recherche réfute la « pensée » de l'IA

Le modèle Centaur a fait sensation : il prétendait imiter la pensée humaine sur 160 tâches cognitives — de la mémoire à la prise de décision. Une nouvelle…

Traité par IA depuis Science Daily AI ; édité par Hamidun News
Centaur connaissait les réponses, mais ne comprenait pas les questions : la recherche réfute la « pensée » de l'IA
Source : Science Daily AI. Collage: Hamidun News.
◐ Écouter l'article

Centaur Connaissait les Réponses, Mais Ne Comprenait Pas les Questions : La Recherche Réfute la « Pensée » de l'IA

Centaur a affirmé une avancée : une IA aurait apparemment appris à imiter la pensée humaine dans 160 tâches cognitives simultanément — de la mémoire à la prise de décision. Une nouvelle recherche réfute cette affirmation : le modèle ne pensait pas, il mémorisait des modèles.

Le Vieux Débat, un Nouvel Acteur

La question sur la nature de la pensée humaine est l'une des plus anciennes en psychologie. La pensée est-elle un système unifié avec un « moteur » commun, ou un ensemble de modules spécialisés, chacun responsable de son propre domaine : mémoire, attention, langage, navigation spatiale, prise de décision ? Ce n'est pas un jeu de mots académique.

La réponse détermine comment concevoir les tests des capacités cognitives, comment traiter les troubles comme la démence ou la dyslexie, et comment concevoir les systèmes d'IA qui prétendent avoir une « compréhension ». Au cours de décennies de débat, aucun consensus unique n'a émergé. Centaur est apparu comme une réponse possible d'une direction inattendue.

L'idée : former une IA sur des données relatives au comportement humain dans les tests cognitifs, puis observer — si le modèle reproduit le même comportement, il a « saisi » la structure de la pensée. Les auteurs ont affirmé que Centaur réalisait 160 tâches cognitives différentes avec une précision comparable à celle des humains. L'ampleur de l'affirmation était rare : aucun modèle auparavant n'avait prétendu une telle couverture cognitive.

Où l'Argument s'Effondre

Les chercheurs qui ont indépendamment vérifié le travail de Centaur ont découvert un problème fondamental : les résultats élevés s'expliquent non pas par une « compréhension », mais par une mémorisation. Vulnérabilités méthodologiques spécifiques :

  • Chevauchement des données : l'ensemble d'entraînement se chevauche avec l'ensemble de test — le modèle a effectivement « vu » les réponses correctes avant l'évaluation
  • Aucun transfert : sur des tâches inconnues avec la même structure, le modèle n'a pas montré de résultats cohérents
  • Modèle sans mécanisme : une correspondance élevée avec les réponses humaines ne signifie pas reproduire les processus cognitifs — seulement leur forme externe
  • Vérification faible : les auteurs n'ont pas effectué de tests sur des tâches spécialement modifiées où les réponses mémorisées ne fonctionneraient pas

Selon les critiques, c'est un cas classique : le modèle savait quoi répondre sans comprendre la question.

Pourquoi Cela Importe

L'affirmation de Centaur n'était pas seulement scientifique — elle était instrumentale. Si l'IA modélisait réellement les processus cognitifs, cela ouvrirait une nouvelle méthode pour étudier l'esprit : au lieu d'expériences neuropsychologiques coûteuses, les théories pourraient être testées directement sur les modèles d'IA. Cela accélérerait radicalement la science cognitive. Mais la limite entre « mémorisation » et « pensée » dans l'évaluation de l'IA reste à franchir. Les modèles de langage affichent régulièrement des scores élevés sur les benchmarks — et à l'examen détaillé, il s'avère que derrière cela se trouve la reproduction de modèles à partir des données d'entraînement, non la généralisation.

«

Le modèle savait quoi répondre — mais ne savait pas pourquoi », — c'est à peu près comment les critiques formulent l'essence de l'objection à Centaur.

L'histoire ici n'est pas nouvelle. Chaque fois qu'une IA obtient un score élevé en « compréhension », un examen détaillé suit — et il s'avère que le test mesurait autre chose. Centaur s'inscrit dans ce modèle.

Ce Que Cela Signifie

Un benchmark convaincant et la véritable compréhension sont des choses différentes. Jusqu'à ce que des normes émergent qui séparent fondamentalement la mémorisation de modèles de la généralisation cognitive, les affirmations sur « l'IA qui pense comme un humain » resteront discutables. Pour la science cognitive, l'étape suivante est évidente : développer des tests qui par définition ne peuvent pas être réussis par la mémorisation.

ZK
Hamidun News
Actualités IA sans bruit. Sélection éditoriale quotidienne de plus de 400 sources. Produit de Zhemal Khamidun, Head of AI chez Alpina Digital.

Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?

AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.

Qu'en pensez-vous ?
Chargement des commentaires…