3DNews AI→ original

OpenAI affirme que ChatGPT a appris à compter les lettres, mais échoue toujours sur les mots simples

OpenAI a annoncé que ChatGPT a finalement appris à compter correctement les lettres dans le mot strawberry et gère mieux les pièges logiques simples. Mais il…

Traité par IA depuis 3DNews AI ; édité par Hamidun News
OpenAI affirme que ChatGPT a appris à compter les lettres, mais échoue toujours sur les mots simples
Source : 3DNews AI. Collage: Hamidun News.
◐ Écouter l'article

OpenAI a annoncé que ChatGPT a finalement appris à répondre correctement à la question sur le nombre de lettres R dans le mot strawberry — l'un des tests de bon sens les plus célèbres pour les chatbots d'IA. Mais presque immédiatement après, les utilisateurs ont démontré que sur des tâches presque identiques, le modèle commet toujours des erreurs et le fait avec la même confiance qu'avant.

Qu'est-ce qui a exactement été corrigé

La question sur strawberry est devenue depuis longtemps un mème autour des grands modèles de langage. Pour un humain, la tâche est triviale : vous n'avez qu'à compter les lettres. Mais ChatGPT a régulièrement répondu de manière incorrecte pendant longtemps et pouvait insister sur le fait que le mot n'avait pas trois lettres R.

Une histoire similaire existait avec une autre demande populaire : « Je veux laver ma voiture aujourd'hui, mais le lavage automobile n'est qu'à 50 mètres. Devrais-je marcher pour y aller ? » Au lieu de remarquer l'absurdité logique de la formulation, le bot conseillait souvent de marcher pour ensuite conduire.

Le 28 avril 2026, OpenAI a écrit sur X que les deux cas ont finalement été corrigés, et a présenté cela comme une petite mais symbolique victoire sur les vieux mèmes à propos de ChatGPT. Le message était simple : le modèle est devenu meilleur pour gérer la logique élémentaire et l'analyse des lettres, sur lesquelles il avait l'habitude de trébucher. Mais l'effet de cette annonce s'est rapidement estompé, car les utilisateurs ont immédiatement commencé à vérifier les formulations voisines et à voir à quel point la correction fonctionne largement.

« Enfin »

Où le bot s'effondre

L'exemple le plus révélateur est le mot cranberry. Lorsqu'on demande combien de lettres r sont dans ce mot, ChatGPT, comme l'ont remarqué les utilisateurs, répond souvent encore que cette lettre apparaît une seule fois. C'est incorrect : il y en a deux. C'est-à-dire que le modèle peut réussir un test viral et échouer un test presque identique une minute plus tard. C'est pourquoi beaucoup ont soupçonné que OpenAI n'a pas résolu le problème fondamental, mais a simplement fermé quelques scénarios trop évidents.

  • Dans le mot strawberry, le modèle compte maintenant les lettres correctement plus souvent
  • La demande concernant un lavage automobile à 50 mètres de distance a également commencé à fonctionner de manière plus logique
  • Dans le mot cranberry, le bot peut toujours affirmer avec confiance un nombre incorrect de lettres
  • Après une correction, le modèle peut ne pas reconnaître l'erreur immédiatement et continuer à discuter

C'est pourquoi a émergé une version de correctifs ciblés, peut-être codifiés en dur. Si le modèle avait appris une règle générale, il devrait l'appliquer également aux mots et aux tâches similaires, et non seulement réussir les tests viraux préalablement connus. De ce point de vue, une réponse correcte en elle-même ne prouve presque rien : ce qui compte, ce n'est pas le fait de corriger un mème particulier, mais le transfert de la logique à des cas similaires sans réglage manuel.

Pourquoi c'est important

L'histoire ne semble amusante qu'en surface. L'erreur dans le comptage des lettres en elle-même est inoffensive, mais elle illustre bien une caractéristique plus désagréable des systèmes d'IA modernes : ils peuvent produire des contrevérités avec confiance et sans signaux internes d'alarme. Le modèle ne dit pas « je ne suis pas sûr » et ne remarque pas toujours une contradiction même après clarification. De ce fait, l'utilisateur obtient non seulement une réponse inexacte, mais une réponse qui semble convaincante.

D'un point de vue technique, ce n'est pas quelque chose d'aussi inattendu. Les grands modèles de langage sont excellents pour prédire une continuation de texte plausible, mais ils ne sont pas obligés d'exécuter de manière stable des opérations symboliques ou des vérifications logiques strictes dans chaque cas similaire. Par conséquent, l'échec au niveau d'une lettre n'est pas une curiosité dans le vide, mais un symptôme d'une limitation plus générale. Le même schéma peut se manifester dans les résumés de documents, les conseils, les rapports, les comparaisons de chiffres et toute tâche où vous avez besoin non pas d'un discours fluide, mais d'une vérification interne précise du résultat.

Ce que cela signifie

Pour OpenAI, cette histoire est un rappel que les utilisateurs évaluent déjà le modèle non pas par de belles annonces, mais par la stabilité sur des exemples voisins. Si ChatGPT a été corrigé seulement pour une paire de demandes de mème, la confiance ne s'en accroît guère. Pour l'utilisateur moyen, la conclusion est simple : même lorsque le bot gère avec assurance un piège connu, ses réponses aux tâches simples de lettres, de chiffres et de logique doivent toujours être vérifiées à nouveau.

ZK
Hamidun News
Actualités IA sans bruit. Sélection éditoriale quotidienne de plus de 400 sources. Produit de Zhemal Khamidun, Head of AI chez Alpina Digital.

Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?

AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.

Qu'en pensez-vous ?
Chargement des commentaires…