OpenAI afirma que ChatGPT aprendeu a contar letras, mas ainda erra em palavras simples
OpenAI anunciou que ChatGPT finalmente aprendeu a contar corretamente as letras na palavra strawberry e lida melhor com armadilhas lógicas simples. Mas é…
Processado por IA de 3DNews AI; editado por Hamidun News
OpenAI anunciou que ChatGPT finalmente aprendeu a responder corretamente a pergunta sobre o número de letras R na palavra strawberry — um dos testes de senso comum mais famosos para chatbots de IA. Mas quase imediatamente depois, usuários demonstraram que em tarefas quase idênticas, o modelo ainda comete erros e o faz com a mesma confiança de antes.
O que exatamente foi corrigido
A pergunta sobre strawberry há muito se tornou um meme entre modelos de linguagem grandes. Para um humano, a tarefa é trivial: você só precisa contar as letras. Mas ChatGPT regularmente respondeu incorretamente durante muito tempo e podia insistir que a palavra não tinha três letras R.
Uma história semelhante existia com outro pedido popular: "Quero lavar meu carro hoje, mas a lavagem de carros fica a apenas 50 metros de distância. Devo caminhar para chegar lá?" Em vez de notar o absurdo lógico da formulação, o bot frequentemente aconselhava caminhar para depois dirigir.
Em 28 de abril de 2026, OpenAI escreveu no X que ambos os casos foram finalmente corrigidos, e apresentou isso como uma pequena, mas simbólica vitória sobre os velhos memes sobre ChatGPT. A mensagem era simples: o modelo ficou melhor em lidar com lógica elementar e análise de letras, em que costumava tropeçar. Mas o efeito deste anúncio rapidamente desapareceu, porque usuários imediatamente começaram a verificar formulações vizinhas e a ver o quão amplamente a correção funciona.
"Finalmente"
Onde o bot falha
O exemplo mais revelador é a palavra cranberry. Quando perguntado quantas letras r estão nesta palavra, ChatGPT, como os usuários notaram, ainda frequentemente responde que tal letra aparece uma vez. Isto é incorreto: há duas. Ou seja, o modelo pode passar em um teste viral e falhar em um teste quase idêntico um minuto depois. É por isso que muitos suspeitaram que OpenAI não resolveu o problema raiz, mas simplesmente fechou alguns cenários muito óbvios.
- Na palavra strawberry, o modelo agora conta letras mais frequentemente de forma correta
- O pedido sobre uma lavagem de carros a 50 metros de distância também começou a funcionar de forma mais lógica
- Na palavra cranberry, o bot ainda pode confidentemente nomear um número incorreto de letras
- Após uma correção, o modelo pode não reconhecer o erro imediatamente e, em vez disso, continuar a argumentar
É por isso que surgiu uma versão sobre patches direcionados, possivelmente codificados. Se o modelo tivesse aprendido uma regra geral, deveria aplicá-la igualmente a palavras e tarefas semelhantes, não apenas passar testes virais pré-conhecidos. Deste ponto de vista, uma resposta correta por si só quase não prova nada: o que importa não é o fato de corrigir um meme específico, mas a transferência da lógica para casos semelhantes sem ajuste manual.
Por que isso importa
A história parece engraçada apenas na superfície. O erro na contagem de letras por si só é inofensivo, mas demonstra bem uma característica mais desagradável dos sistemas de IA modernos: eles podem produzir falsidades com confiança e sem sinais internos de alarme. O modelo não diz "não tenho certeza" e nem sempre nota uma contradição mesmo após esclarecimento. Por causa disso, o usuário recebe não apenas uma resposta imprecisa, mas uma resposta que parece convincente.
Do ponto de vista técnico, isso não é algo tão inesperado. Modelos de linguagem grandes são ótimos em prever continuação de texto plausível, mas não são obrigados a executar operações simbólicas estáveis ou verificações lógicas rigorosas em cada caso semelhante. Portanto, a falha no nível de uma letra não é uma curiosidade no vácuo, mas um sintoma de uma limitação mais geral. O mesmo padrão pode se manifestar em resumos de documentos, conselhos, relatórios, comparações de números e qualquer tarefa onde você precisa não de fala suave, mas de verificação interna precisa do resultado.
O que isso significa
Para OpenAI, esta história é um lembrete de que os usuários já estão avaliando o modelo não por anúncios bonitos, mas por estabilidade em exemplos vizinhos. Se ChatGPT foi corrigido apenas para um par de pedidos de memes, a confiança não cresce muito a partir disso. Para o usuário médio, a conclusão é simples: mesmo quando o bot lida com confiança com uma armadilha conhecida, suas respostas a tarefas simples de letras, números e lógica ainda precisam ser verificadas novamente.
Quer parar de ler sobre IA e começar a usar?
AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.