3DNews AI→ original

OpenAI afirma que ChatGPT aprendeu a contar letras, mas ainda erra em palavras simples

OpenAI anunciou que ChatGPT finalmente aprendeu a contar corretamente as letras na palavra strawberry e lida melhor com armadilhas lógicas simples. Mas é…

Processado por IA de 3DNews AI; editado por Hamidun News
OpenAI afirma que ChatGPT aprendeu a contar letras, mas ainda erra em palavras simples
Fonte: 3DNews AI. Colagem: Hamidun News.
◐ Ouvir artigo

OpenAI anunciou que ChatGPT finalmente aprendeu a responder corretamente a pergunta sobre o número de letras R na palavra strawberry — um dos testes de senso comum mais famosos para chatbots de IA. Mas quase imediatamente depois, usuários demonstraram que em tarefas quase idênticas, o modelo ainda comete erros e o faz com a mesma confiança de antes.

O que exatamente foi corrigido

A pergunta sobre strawberry há muito se tornou um meme entre modelos de linguagem grandes. Para um humano, a tarefa é trivial: você só precisa contar as letras. Mas ChatGPT regularmente respondeu incorretamente durante muito tempo e podia insistir que a palavra não tinha três letras R.

Uma história semelhante existia com outro pedido popular: "Quero lavar meu carro hoje, mas a lavagem de carros fica a apenas 50 metros de distância. Devo caminhar para chegar lá?" Em vez de notar o absurdo lógico da formulação, o bot frequentemente aconselhava caminhar para depois dirigir.

Em 28 de abril de 2026, OpenAI escreveu no X que ambos os casos foram finalmente corrigidos, e apresentou isso como uma pequena, mas simbólica vitória sobre os velhos memes sobre ChatGPT. A mensagem era simples: o modelo ficou melhor em lidar com lógica elementar e análise de letras, em que costumava tropeçar. Mas o efeito deste anúncio rapidamente desapareceu, porque usuários imediatamente começaram a verificar formulações vizinhas e a ver o quão amplamente a correção funciona.

"Finalmente"

Onde o bot falha

O exemplo mais revelador é a palavra cranberry. Quando perguntado quantas letras r estão nesta palavra, ChatGPT, como os usuários notaram, ainda frequentemente responde que tal letra aparece uma vez. Isto é incorreto: há duas. Ou seja, o modelo pode passar em um teste viral e falhar em um teste quase idêntico um minuto depois. É por isso que muitos suspeitaram que OpenAI não resolveu o problema raiz, mas simplesmente fechou alguns cenários muito óbvios.

  • Na palavra strawberry, o modelo agora conta letras mais frequentemente de forma correta
  • O pedido sobre uma lavagem de carros a 50 metros de distância também começou a funcionar de forma mais lógica
  • Na palavra cranberry, o bot ainda pode confidentemente nomear um número incorreto de letras
  • Após uma correção, o modelo pode não reconhecer o erro imediatamente e, em vez disso, continuar a argumentar

É por isso que surgiu uma versão sobre patches direcionados, possivelmente codificados. Se o modelo tivesse aprendido uma regra geral, deveria aplicá-la igualmente a palavras e tarefas semelhantes, não apenas passar testes virais pré-conhecidos. Deste ponto de vista, uma resposta correta por si só quase não prova nada: o que importa não é o fato de corrigir um meme específico, mas a transferência da lógica para casos semelhantes sem ajuste manual.

Por que isso importa

A história parece engraçada apenas na superfície. O erro na contagem de letras por si só é inofensivo, mas demonstra bem uma característica mais desagradável dos sistemas de IA modernos: eles podem produzir falsidades com confiança e sem sinais internos de alarme. O modelo não diz "não tenho certeza" e nem sempre nota uma contradição mesmo após esclarecimento. Por causa disso, o usuário recebe não apenas uma resposta imprecisa, mas uma resposta que parece convincente.

Do ponto de vista técnico, isso não é algo tão inesperado. Modelos de linguagem grandes são ótimos em prever continuação de texto plausível, mas não são obrigados a executar operações simbólicas estáveis ou verificações lógicas rigorosas em cada caso semelhante. Portanto, a falha no nível de uma letra não é uma curiosidade no vácuo, mas um sintoma de uma limitação mais geral. O mesmo padrão pode se manifestar em resumos de documentos, conselhos, relatórios, comparações de números e qualquer tarefa onde você precisa não de fala suave, mas de verificação interna precisa do resultado.

O que isso significa

Para OpenAI, esta história é um lembrete de que os usuários já estão avaliando o modelo não por anúncios bonitos, mas por estabilidade em exemplos vizinhos. Se ChatGPT foi corrigido apenas para um par de pedidos de memes, a confiança não cresce muito a partir disso. Para o usuário médio, a conclusão é simples: mesmo quando o bot lida com confiança com uma armadilha conhecida, suas respostas a tarefas simples de letras, números e lógica ainda precisam ser verificadas novamente.

ZK
Hamidun News
Notícias de AI sem ruído. Seleção editorial diária de mais de 400 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.

Quer parar de ler sobre IA e começar a usar?

AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.

O que você acha?
Carregando comentários…