Gemini 3.1 Pro superó a ChatGPT 5.4 y Claude Opus 4.6 en una prueba de generación de texto
Gemini 3.1 Pro ganó una comparación de modelos de generación de texto frente a ChatGPT 5.4 y Claude Opus 4.6. El autor sometió a los tres sistemas a cuatro…
Procesado por IA desde Habr AI; editado por Hamidun News
Gemini 3.1 Pro se convirtió en la ganadora en una comparación de modelos de generación de texto realizada por el autor, superando a ChatGPT 5.4 y Claude Opus 4.6. La brecha fue pequeña, pero el autor llamó a Gemini la herramienta más equilibrada para tareas literarias y emocionales.
Cómo Se Probó
La comparación no se basó en código, búsqueda o matemáticas, sino en lo que sigue siendo el principal caso de uso de IA para usuarios convencionales: escribir texto. Para ello, se dieron cuatro tareas a tres modelos. Necesitaban crear ciencia ficción cómica, fantasía clásica, terror psicológico y una breve historia emocional sobre una persona perdida en el bosque. La puntuación máxima en cada ronda fue de tres puntos, y la evaluación general se basó en la precisión del género, legibilidad, pertinencia de los detalles e impresión general del resultado.
El enfoque resultó ser subjetivo, pero justamente en eso reside su valor. Esta prueba no mide la inteligencia abstracta, sino que muestra cómo se comporta un modelo en una tarea editorial real: ¿mantiene el tono, preserva la estructura, evita la verborragia excesiva y puede transmitir emoción sin explicaciones innecesarias? El autor señala por separado que algunos modelos tienden a sobrecargar el texto, mientras que otros eligen la concisión. Para generar publicaciones, borradores, historias y guiones, esto a menudo es más importante que los puntos de referencia áridos.
Resultados por Modelo
Gemini 3.1 Pro mostró el mejor resultado — 11,5 de 12 puntos posibles. Manejó con confianza la tarea cómica y se desempeñó mejor que las otras en la historia emocional sobre ansiedad en el bosque. Claude Opus 4.6 completó la prueba con 11 puntos, y ChatGPT 5.4 con 10. Ninguno de ellos fracasó: los tres modelos demostraron un nivel alto en general y diferían más en estilo que en calidad.
- Gemini 3.1 Pro — 11,5 puntos; fuerte en precisión de género y entrega concisa
- Claude Opus 4.6 — 11 puntos; construye bien la atmósfera, pero a veces sobrecarga el texto
- ChatGPT 5.4 — 10 puntos; estable, pero ocasionalmente hace elecciones estilísticamente cuestionables
- En la tarea de terror, los tres modelos recibieron idénticos 2,5 puntos
- El autor llamó al modelo de OpenAI el más económico en precio
Por Qué Gemini Está Adelante
La razón principal de la victoria de Gemini, según el autor, es el equilibrio. El modelo no intenta impresionar con la longitud de la respuesta, no simplifica en exceso cada escena y no pierde el marco del género. En la historia cómica, esto se manifestó como un ritmo más vivo y humor efectivo, y en el texto emocional — como una escalada clara desde la negación hacia el pánico y la desesperación. Para tareas de contenido, esto es crítico: si un modelo escribe más corto pero más preciso, es más fácil para un editor trabajar con el texto y pasar menos tiempo limpiándolo.
Los competidores tenían sus puntos débiles. ChatGPT 5.4, según la observación del autor, a veces marca la estructura de la historia demasiado explícitamente — por ejemplo, enfatiza los clímax de los capítulos, lo que hace que el texto pierda su calidad natural. Claude Opus 4.6, por el contrario, construye bien la atmósfera, especialmente en historias sobre aislamiento y paranoia, pero a veces se vuelve demasiado elaborado y analítico. Esto no rompe completamente la calidad, pero reduce el impacto emocional, que en el texto literario debe funcionar más rápido.
El ganador general fue Gemini 3.1 Pro, aunque los otros dos participantes también mostraron buenos resultados.
El autor señala por separado que no considera este resultado un veredicto universal del mercado. La elección del modelo sigue dependiendo del gusto y la tarea: para algunos, la claridad y previsibilidad de ChatGPT importa más, para otros la atmósfera de Claude es más cercana. Además, para la generación básica de texto, en su opinión, las soluciones gratuitas como DeepSeek pueden ser suficientes. Pero si nos enfocamos específicamente en la combinación de estilo, concisión y precisión de género en esta prueba, el liderazgo de Gemini parece merecido.
Lo Que Significa
Para editores, autores y equipos de contenido, la conclusión es bastante práctica: necesita encontrar no el modelo "más inteligente" en general, sino uno que maneje mejor un formato específico. En esta comparación, Gemini 3.1 Pro resultó ser la opción más equilibrada para tarefas de texto, pero la diferencia entre los participantes es pequeña. Esto significa que en trabajo real, el ganador debe elegirse no por un nombre resonante, sino por cuántas correcciones hay que hacer después del primer borrador.
¿Quieres dejar de leer sobre IA y empezar a usarla?
AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.