Gemini 3.1 Pro superou ChatGPT 5.4 e Claude Opus 4.6 em teste de geração de texto
Gemini 3.1 Pro venceu uma comparação entre modelos de geração de texto, enfrentando ChatGPT 5.4 e Claude Opus 4.6. O autor submeteu os três sistemas a quatro…
Processado por IA de Habr AI; editado por Hamidun News
Gemini 3.1 Pro se tornou a vencedora em uma comparação de modelos para geração de texto feita pelo autor, superando ChatGPT 5.4 e Claude Opus 4.6. A diferença foi pequena, mas o autor chamou Gemini de ferramenta mais equilibrada para tarefas literárias e emocionais.
Como Foi Testado
A comparação não foi construída em código, busca ou matemática, mas naquilo que continua sendo o principal caso de uso de IA para usuários em massa: escrever texto. Para isso, três modelos receberam quatro tarefas. Precisavam criar ficção científica cômica, fantasia clássica, horror psicológico e uma curta história emocional sobre uma pessoa perdida na floresta. A pontuação máxima para cada rodada era três pontos, e a avaliação geral era baseada no acerto de gênero, legibilidade, adequação dos detalhes e impressão geral do resultado.
A abordagem acabou sendo subjetiva, mas justamente aí reside seu valor. Esse tipo de teste não mede inteligência abstrata, mas mostra como um modelo se comporta em uma tarefa editorial real: mantém o tom, preserva a estrutura, evita verbosidade excessiva e consegue transmitir emoção sem explicações desnecessárias. O autor observa separadamente que alguns modelos tendem a sobrecarregar o texto, enquanto outros escolhem a concisão. Para gerar posts, rascunhos, histórias e roteiros, isso costuma ser mais importante que benchmarks áridos.
Resultados por Modelo
Gemini 3.1 Pro apresentou o melhor resultado — 11,5 de 12 pontos possíveis. Ela lidou com confiança a tarefa de comédia e se saiu melhor que as outras na história emocional sobre ansiedade na floresta. Claude Opus 4.6 completou o teste com 11 pontos, e ChatGPT 5.4 com 10. Nenhuma delas fracassou: todos os três modelos demonstraram um nível alto em geral e diferiram mais em estilo do que em qualidade.
- Gemini 3.1 Pro — 11,5 pontos; forte em acerto de gênero e entrega concisa
- Claude Opus 4.6 — 11 pontos; constrói bem a atmosfera, mas às vezes sobrecarrega o texto
- ChatGPT 5.4 — 10 pontos; estável, mas ocasionalmente faz escolhas estilisticamente questionáveis
- Na tarefa de horror, todos os três modelos receberam idênticos 2,5 pontos
- O autor chamou o modelo OpenAI de mais econômico em preço
Por Que Gemini Está na Frente
A principal razão para a vitória do Gemini, segundo o autor, é o equilíbrio. O modelo não tenta impressionar com comprimento de resposta, não simplifica demais cada cena e não perde a moldura de gênero. Na história cômica, isso se manifestou em um ritmo mais vivo e humor eficaz, e no texto emocional — como escalação clara da negação para pânico e desespero. Para tarefas de conteúdo, isso é crítico: se um modelo escreve mais curto mas com mais precisão, é mais fácil para um editor trabalhar com o texto e gastar menos tempo limpando-o.
Os concorrentes tinham seus pontos fracos. ChatGPT 5.4, pela observação do autor, às vezes marca a estrutura da história de forma muito explícita — por exemplo, enfatiza clímax dos capítulos, o que faz o texto perder sua qualidade natural. Claude Opus 4.6, inversamente, constrói bem a atmosfera, especialmente em histórias sobre isolamento e paranoia, mas às vezes se torna muito elaborado e analítico. Isso não quebra completamente a qualidade, mas reduz o impacto emocional, que em texto literário deve ter efeito mais rápido.
O vencedor geral foi Gemini 3.1 Pro, embora os outros dois participantes também tivessem apresentado bons resultados.
O autor observa separadamente que não considera esse resultado um veredicto universal do mercado. A escolha do modelo ainda depende do gosto e da tarefa: para alguns, a clareza e previsibilidade do ChatGPT importam mais, para outros a atmosfera do Claude é mais próxima. Além disso, para geração básica de texto, na opinião dele, soluções gratuitas como DeepSeek podem ser suficientes. Mas se focamos especificamente na combinação de estilo, concisão e precisão de gênero neste teste, a liderança do Gemini parece merecida.
O Que Isso Significa
Para editores, autores e equipes de conteúdo, a conclusão é bastante prática: você precisa encontrar não o modelo "mais inteligente" em geral, mas aquele que melhor lida com um formato específico. Nesta comparação, Gemini 3.1 Pro se mostrou a opção mais equilibrada para tarefas de texto, mas a diferença entre os participantes é pequena. Isso significa que em trabalho real, o vencedor deve ser escolhido não por um nome de peso, mas por quantas correções precisam ser feitas após o primeiro rascunho.
Quer parar de ler sobre IA e começar a usar?
AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.