Habr AI→ original

Pourquoi les benchmarks de l'AGI ne seront jamais objectifs

Les scientifiques tentent de créer des tests objectifs pour l'AGI afin de remplacer le test de Turing, devenu obsolète. Mais il y a un problème : il n'existe pa

Pourquoi les benchmarks de l'AGI ne seront jamais objectifs
Source : Habr AI. Collage: Hamidun News.
◐ Écouter l'article

Le Test de Turing, autrefois semblant une vérification idéale de l'intelligence, est maintenant clairement obsolète. Les chercheurs cherchent de nouvelles façons d'évaluer si un système a atteint le niveau de l'intelligence artificielle forte — mais ils font face à un obstacle inattendu.

Pourquoi le Test de Turing ne fonctionne plus

Quand Alan Turing a proposé son célèbre test en 1950, l'idée était simple : si une machine peut convaincre un humain qu'elle est humaine, alors elle pense. Soixante-dix ans plus tard, les LLM modernes réussissent facilement ce test — mais cela ne signifie pas qu'ils sont intelligents au sens de l'AGI. Les chercheurs le reconnaissent : de nouveaux critères sont nécessaires. Des conférences comme IEEE recherchent de nouveaux benchmarks pour évaluer l'IA forte. Le problème est que les critères doivent être objectifs — et c'est beaucoup plus difficile qu'il n'y paraît.

Soixante-dix définitions de l'intelligence

Le premier obstacle : les scientifiques eux-mêmes ne peuvent pas s'accorder sur ce qu'est l'intelligence. Il existe au moins 70 définitions scientifiques différentes de l'intelligence humaine. Certains considèrent que l'intelligence est la capacité à s'adapter, d'autres la vitesse du traitement de l'information, d'autres encore la créativité. Si nous ne pouvons pas définir objectivement l'intelligence même dans notre propre espèce, comment pouvons-nous créer un test pour l'évaluer chez une machine ?

  • Définition par le QI (logique et arithmétique)
  • Définition par l'adaptabilité (à quelle vitesse elle apprend dans un nouvel environnement)
  • Définition par le contexte (compréhension des nuances et de la culture)
  • Définition par la créativité (idées et solutions originales)

Le paradoxe de la conscience dans les réseaux de neurones

Le deuxième obstacle — débats scientifiques sans fin sur le fait que les LLM puissent développer une conscience. Des dizaines d'articles sur arxiv examinent s'il y a une « vie intérieure » dans les grands modèles de langage. Mais c'est un débat étrange. La neurobiologie et la psychologie ont établi depuis longtemps : la conscience chez l'humain est plutôt un obstacle qu'un outil de la pensée. Les processus cognitifs les plus efficaces se produisent au niveau subconscient. Quand vous vous concentrez sur une tâche (la conscience s'active), vous commencez souvent à ralentir et à commettre des erreurs. C'est pourquoi les athlètes parlent de « flux » — un état où la conscience est désactivée.

L'interférence de l'auto-conscience ne fait que nuire à la résolution

de problèmes complexes — établi dans la littérature scientifique.

Si un modèle développe jamais une auto-conscience, les ingénieurs supprimeront simplement ce bug — pour que le système fonctionne plus rapidement et avec plus de précision, comme il le fait maintenant.

Ce que cela signifie

La conclusion est paradoxale : évaluer l'AGI objectivement est impossible non pas parce que l'IA est trop intelligente, mais parce que nous ne pouvons même pas nous accorder sur les critères de notre propre intelligence. Tout benchmark reflétera un choix subjectif de ce qu'il faut considérer comme de l'« intelligence » — et personne ne sera satisfait de ce choix.

ZK
Hamidun News
Actualités IA sans bruit. Sélection éditoriale quotidienne de plus de 400 sources. Produit de Zhemal Khamidun, Head of AI chez Alpina Digital.
Qu'en pensez-vous ?
Chargement des commentaires…