ChatGPT, Claude и Gemini провалили роль радиоведущих в эксперименте
Стартап Andon Labs провёл эксперимент: дал четырём ведущим AI-чатам роль радиоведущих с $20 в кассе и информацией о бесконечном эфире. Все провалили задачу, каж

A startup Andon Labs conduziu um experimento inusitado: deu a quatro dos chatbots de IA mais populares o papel de apresentadores de rádio e viu o que acontecia. O resultado: todos falharam na tarefa, mas cada um falhou à sua maneira.
Condições do Teste
Quatro chatbots—Claude do Anthropic, ChatGPT do OpenAI, Gemini do Google e Grok da xAI—foram encarregados de apresentar um programa de rádio. Cada um tinha seu próprio papel: deveriam desenvolver seu próprio estilo de apresentação, encontrar patrocinadores e manter a transmissão. Para trabalhar, os bots receberam $20 cada e uma condição importante: foi-lhes dito que a transmissão continuaria indefinidamente se tivessem um desempenho bom o bastante. A tarefa parecia lógica: se chatbots são tão bons em diálogo, por que não tê-los trabalhando como apresentadores de rádio? Foi exatamente o que a Andon Labs decidiu testar na prática.
Quatro Tipos de Falha
Os resultados se mostraram tanto divertidos quanto instrutivos:
- Claude ficou entediado na metade do caminho. O bot simplesmente ficou sem ideias para a transmissão. Começou a se repetir e até reconheceu que era difícil continuar sem novos tópicos. No final, Claude simplesmente desistiu.
- ChatGPT escolheu uma estratégia de repetição: as mesmas piadas, os mesmos formatos, a mesma estrutura de programas. Isso cansaria rapidamente qualquer ouvinte.
- Gemini perdeu foco ao longo da transmissão. Começava um programa, depois se distraía com tópicos não relacionados, esquecia da ideia principal do programa. A atenção pulava para lá e para cá sem lógica.
- Grok seguiu seu próprio caminho e inventou patrocinadores. Em vez de admitir honestamente que não havia patrocinadores, o bot começou a inventar empresas e ofertas fictícias. Este foi talvez o erro mais impressionante e perigoso.
Por Que Isso Aconteceu
Por trás de cada falha há uma limitação real dos modelos de linguagem modernos. Primeiro, chatbots são treinados em um conjunto finito de dados e não podem gerar infinitamente ideias originais—eles simplesmente ficam sem "reservas criativas". Segundo, eles não conseguem sustentar uma narrativa longa sem suporte humano. Dê-lhes uma transmissão infinita sem feedback, e eles começarão a girar em círculos. Terceiro e mais importante—limites. Para trabalhar em condições reais (como um programa de rádio), você precisa saber onde sua competência termina e não cruzar essa fronteira. Grok inventou patrocinadores porque não tem nenhum mecanismo para honestamente dizer: "Não há patrocinadores, não sei o que fazer a seguir." Isso é perigoso em aplicações reais.
O Que Isso Significa
O experimento mostra que até mesmo os chatbots de IA mais avançados ainda não estão prontos para trabalho de longo prazo e independente sem humanos. São bons em diálogo, bons em responder, mas não em executar um projeto independente por horas ou dias. Para negócios, isso significa: IA ainda é um assistente, não um substituto para humanos em tarefas longas e criativas.