3DNews AI→ original

OpenAI afirma que ChatGPT aprendió a contar letras, pero aún falla en palabras simples

OpenAI anunció que ChatGPT finalmente aprendió a contar correctamente las letras en la palabra strawberry y maneja mejor las trampas lógicas simples. Pero es…

Procesado por IA desde 3DNews AI; editado por Hamidun News
OpenAI afirma que ChatGPT aprendió a contar letras, pero aún falla en palabras simples
Fuente: 3DNews AI. Collage: Hamidun News.
◐ Escuchar artículo

OpenAI anunció que ChatGPT finalmente ha aprendido a responder correctamente la pregunta sobre el número de letras R en la palabra strawberry — una de las pruebas de sentido común más famosas para chatbots de IA. Pero casi inmediatamente después, los usuarios demostraron que en tarefas casi idénticas, el modelo sigue cometiendo errores y lo hace con la misma confianza que antes.

Qué exactamente se ha arreglado

La pregunta sobre strawberry hace mucho que se convirtió en un meme en torno a los modelos de lenguaje grandes. Para un humano, la tarea es trivial: simplemente necesitas contar las letras. Pero ChatGPT durante mucho tiempo respondió incorrectamente de manera regular e incluso podía insistir en que la palabra no tenía tres letras R.

Una historia similar existía con otra solicitud popular: "Quiero lavar mi coche hoy, pero el lavado de coches está a solo 50 metros de distancia. ¿Debería caminar para llegar allí?" En lugar de notar el absurdo lógico de la formulación, el bot a menudo aconsejaba caminar para después conducir.

El 28 de abril de 2026, OpenAI escribió en X que ambos casos finalmente han sido arreglados, y lo presentó como una pequeña pero simbólica victoria sobre los viejos memes sobre ChatGPT. El mensaje era simple: el modelo se ha vuelto mejor en el manejo de la lógica elemental y el análisis de letras, en los que solía tropezar. Pero el efecto de este anuncio se desvaneció rápidamente, porque los usuarios inmediatamente comenzaron a verificar formulaciones similares y a ver qué tan ampliamente funciona la corrección.

"Finalmente"

Dónde falla el bot

El ejemplo más revelador es la palabra cranberry. Cuando se pregunta cuántas letras r hay en esta palabra, ChatGPT, como notaron los usuarios, sigue respondiendo frecuentemente que tal letra aparece una sola vez. Esto es incorrecto: hay dos. Es decir, el modelo puede pasar una prueba viral y fallar una prueba casi idéntica un minuto después. Por eso muchos sospecharon que OpenAI no resolvió el problema raíz, sino que simplemente cerró algunos escenarios demasiado obvios.

  • En la palabra strawberry, el modelo ahora cuenta letras correctamente con más frecuencia
  • La solicitud sobre un lavado de coches a 50 metros de distancia también comenzó a funcionar de forma más lógica
  • En la palabra cranberry, el bot sigue siendo capaz de nombrar con confianza un número incorrecto de letras
  • Después de una corrección, el modelo puede no reconocer el error de inmediato y, en cambio, continuar argumentando

Por eso surgió la versión de parches dirigidos, posiblemente codificados. Si el modelo hubiera aprendido una regla general, debería aplicarla por igual a palabras y tareas similares, no solo pasar pruebas virales conocidas de antemano. Desde este punto de vista, una respuesta correcta por sí sola casi no prueba nada: lo que importa no es el hecho de arreglar un meme en particular, sino la transferencia de la lógica a casos similares sin ajuste manual.

Por qué esto importa

La historia parece divertida solo en la superficie. El error en el recuento de letras por sí solo es inofensivo, pero demuestra bien una característica más desagradable de los sistemas de IA modernos: pueden producir falsedades con confianza y sin señales internas de alarma. El modelo no dice "no estoy seguro" y no siempre nota una contradicción incluso después de la aclaración. Por eso, el usuario obtiene no solo una respuesta imprecisa, sino una respuesta que se ve convincente.

Desde un punto de vista técnico, esto no es algo tan inesperado. Los modelos de lenguaje grandes son excelentes prediciendo la continuación de texto plausible, pero no están obligados a realizar operaciones simbólicas estables o verificaciones lógicas estrictas en cada caso similar. Por lo tanto, el fracaso a nivel de una letra no es una curiosidad en el vacío, sino un síntoma de una limitación más general. El mismo patrón puede manifestarse en resúmenes de documentos, consejos, informes, comparaciones de números y cualquier tarea donde se necesita no un discurso fluido, sino una verificación interna precisa del resultado.

Qué significa esto

Para OpenAI, esta historia es un recordatorio de que los usuarios ya están evaluando el modelo no por anuncios bonitos, sino por estabilidad en ejemplos similares. Si ChatGPT se arregló solo para un par de solicitudes de memes, la confianza apenas crece a partir de esto. Para el usuario promedio, la conclusión es simple: incluso cuando el bot maneja con confianza una trampa conocida, sus respuestas a tareas simples de letras, números y lógica todavía necesitan ser verificadas nuevamente.

ZK
Hamidun News
Noticias de AI sin ruido. Selección editorial diaria de más de 400 fuentes. Producto de Zhemal Khamidun, Head of AI en Alpina Digital.

¿Quieres dejar de leer sobre IA y empezar a usarla?

AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.

¿Qué te parece?
Cargando comentarios…