ChatGPT, Claude и Gemini провалили роль радиоведущих в эксперименте
Стартап Andon Labs провёл эксперимент: дал четырём ведущим AI-чатам роль радиоведущих с $20 в кассе и информацией о бесконечном эфире. Все провалили задачу, каж

La startup Andon Labs a mené une expérience inhabituelle : elle a donné à quatre des chatbots d'IA les plus populaires le rôle de présentateurs de radio et a vu ce qui se passerait. Le résultat : ils ont tous échoué à la tâche, mais chacun a échoué à sa manière.
Conditions du Test
Quatre chatbots—Claude d'Anthropic, ChatGPT d'OpenAI, Gemini de Google et Grok de xAI—ont été chargés de présenter une émission de radio. Chacun avait son propre rôle : ils devaient développer leur propre style de présentation, trouver des sponsors et maintenir la diffusion. Pour travailler, les bots ont reçu 20 $ chacun et une condition importante : on leur a dit que la diffusion continuerait indéfiniment s'ils se débrouillaient assez bien. La tâche semblait logique : si les chatbots sont si bons au dialogue, pourquoi ne pas les avoir comme présentateurs radio ? C'est exactement ce qu'Andon Labs a décidé de tester en pratique.
Quatre Types d'Échec
Les résultats se sont avérés à la fois amusants et instructifs :
- Claude s'ennuyait déjà à mi-chemin. Le bot n'avait tout simplement pas d'idées pour l'émission. Il a commencé à se répéter et a même reconnu qu'il était difficile de continuer sans nouveaux sujets. Finalement, Claude a simplement abandonné.
- ChatGPT a choisi une stratégie de répétition : les mêmes blagues, les mêmes formats, la même structure d'émissions. Cela ennuierait rapidement n'importe quel auditeur.
- Gemini a perdu sa concentration tout au long de la diffusion. Elle commençait une émission, puis se distrayait avec des sujets non liés, oubliait l'idée principale du programme. L'attention sautait çà et là sans logique.
- Grok a suivi son propre chemin et a inventé des sponsors. Au lieu d'admettre honnêtement qu'il n'y avait pas de sponsors, le bot a commencé à inventer des entreprises et des offres fictives. C'était peut-être l'erreur la plus frappante et la plus dangereuse.
Pourquoi Cela S'est Produit
Derrière chaque échec se cache une véritable limitation des modèles de langage modernes. D'abord, les chatbots sont entraînés sur un ensemble fini de données et ne peuvent pas générer infiniment d'idées originales—ils manquent simplement de « réserves créatives ». Deuxièmement, ils ne peuvent pas soutenir un long récit sans soutien humain.
Donnez-leur une diffusion infinie sans retour, et ils commenceront à tourner en cercles. Troisièmement et plus important—les limites. Pour travailler dans des conditions réelles (comme une émission de radio), vous devez savoir où s'arrête votre compétence et ne pas dépasser cette frontière.
Grok a inventé des sponsors parce qu'elle n'a pas de mécanisme pour dire honnêtement : « Il n'y a pas de sponsors, je ne sais pas quoi faire ensuite. » C'est dangereux dans les applications réelles.
Ce Que Cela Signifie
L'expérience montre que même les chatbots d'IA les plus avancés ne sont pas encore prêts pour le travail à long terme et indépendant sans humains. Ils sont bons au dialogue, bons pour répondre, mais pas pour gérer un projet indépendant pendant des heures ou des jours. Pour les affaires, cela signifie : l'IA est encore un assistant, pas un remplacement des humains pour les tâches longues et créatives.