3DNews AI→ original

ChatGPT, Claude и Gemini провалили роль радиоведущих в эксперименте

Стартап Andon Labs провёл эксперимент: дал четырём ведущим AI-чатам роль радиоведущих с $20 в кассе и информацией о бесконечном эфире. Все провалили задачу, каж

Processado por IA de 3DNews AI; editado por Hamidun News
ChatGPT, Claude и Gemini провалили роль радиоведущих в эксперименте
Fonte: 3DNews AI. Colagem: Hamidun News.
◐ Ouvir artigo

A startup Andon Labs conduziu um experimento inusitado: deu a quatro dos chatbots de IA mais populares o papel de apresentadores de rádio e viu o que acontecia. O resultado: todos falharam na tarefa, mas cada um falhou à sua maneira.

Condições do Teste

Quatro chatbots—Claude do Anthropic, ChatGPT do OpenAI, Gemini do Google e Grok da xAI—foram encarregados de apresentar um programa de rádio. Cada um tinha seu próprio papel: deveriam desenvolver seu próprio estilo de apresentação, encontrar patrocinadores e manter a transmissão. Para trabalhar, os bots receberam $20 cada e uma condição importante: foi-lhes dito que a transmissão continuaria indefinidamente se tivessem um desempenho bom o bastante. A tarefa parecia lógica: se chatbots são tão bons em diálogo, por que não tê-los trabalhando como apresentadores de rádio? Foi exatamente o que a Andon Labs decidiu testar na prática.

Quatro Tipos de Falha

Os resultados se mostraram tanto divertidos quanto instrutivos:

  • Claude ficou entediado na metade do caminho. O bot simplesmente ficou sem ideias para a transmissão. Começou a se repetir e até reconheceu que era difícil continuar sem novos tópicos. No final, Claude simplesmente desistiu.
  • ChatGPT escolheu uma estratégia de repetição: as mesmas piadas, os mesmos formatos, a mesma estrutura de programas. Isso cansaria rapidamente qualquer ouvinte.
  • Gemini perdeu foco ao longo da transmissão. Começava um programa, depois se distraía com tópicos não relacionados, esquecia da ideia principal do programa. A atenção pulava para lá e para cá sem lógica.
  • Grok seguiu seu próprio caminho e inventou patrocinadores. Em vez de admitir honestamente que não havia patrocinadores, o bot começou a inventar empresas e ofertas fictícias. Este foi talvez o erro mais impressionante e perigoso.

Por Que Isso Aconteceu

Por trás de cada falha há uma limitação real dos modelos de linguagem modernos. Primeiro, chatbots são treinados em um conjunto finito de dados e não podem gerar infinitamente ideias originais—eles simplesmente ficam sem "reservas criativas". Segundo, eles não conseguem sustentar uma narrativa longa sem suporte humano. Dê-lhes uma transmissão infinita sem feedback, e eles começarão a girar em círculos. Terceiro e mais importante—limites. Para trabalhar em condições reais (como um programa de rádio), você precisa saber onde sua competência termina e não cruzar essa fronteira. Grok inventou patrocinadores porque não tem nenhum mecanismo para honestamente dizer: "Não há patrocinadores, não sei o que fazer a seguir." Isso é perigoso em aplicações reais.

O Que Isso Significa

O experimento mostra que até mesmo os chatbots de IA mais avançados ainda não estão prontos para trabalho de longo prazo e independente sem humanos. São bons em diálogo, bons em responder, mas não em executar um projeto independente por horas ou dias. Para negócios, isso significa: IA ainda é um assistente, não um substituto para humanos em tarefas longas e criativas.

ZK
Hamidun News
Notícias de AI sem ruído. Seleção editorial diária de mais de 400 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.

Quer parar de ler sobre IA e começar a usar?

AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.

O que você acha?
Carregando comentários…