ZDNet AI→ original

OpenAI Supera Google: ChatGPT Images 2.0 Vence Teste Contra Gemini Nano Banana

ChatGPT Images 2.0 venceu a comparação com Gemini Nano Banana em nove testes de geração de imagens. As principais vantagens do modelo OpenAI—maior precisão…

Processado por IA de ZDNet AI; editado por Hamidun News
OpenAI Supera Google: ChatGPT Images 2.0 Vence Teste Contra Gemini Nano Banana
Fonte: ZDNet AI. Colagem: Hamidun News.
◐ Ouvir artigo

Em uma comparação direta de duas das ferramentas de IA mais proeminentes para imagens, a vitória provou ser não apenas cosmética, mas bastante prática: ChatGPT Images 2.0 cumpre consistentemente requisições, funciona melhor com texto dentro de imagens e raramente perde a intenção do usuário, enquanto Gemini Nano Banana mais frequentemente produz resultados impressionantes mas menos precisos. A comparação foi baseada em nove testes de geração de imagens — desde prompts complexos com múltiplas condições até tarefas onde composição, legendas e aderência ao contexto são importantes.

De acordo com os resultados dos testes, a vantagem foi para a solução da OpenAI: fatores-chave foram a precisão em seguir instruções e um desempenho mais confiante em tipografia. Para o mercado, esta é uma mudança importante, porque o texto dentro do quadro, diagramas, cartões de produtos, pôsteres e interfaces têm sido um ponto fraco para a maioria dos geradores até agora. Essa diferença ilustra bem como o próprio mercado de geração de imagens está mudando.

Um ano atrás, usuários escolhiam entre "bonito" e "rápido", aceitando que texto, tabelas e interfaces ainda precisariam ser corrigidos manualmente no Figma ou Photoshop. Agora o padrão é mais alto: espera-se que modelos montem um banner inteiro, slide, instrução ou cartão de produto sem layout quebrado. Neste modo, a avaliação não é mérito artístico, mas a usabilidade do resultado para publicação.

A OpenAI apresentou ChatGPT Images 2.0 em 21 de abril de 2026 e imediatamente disponibilizou o modelo em todas as camadas do ChatGPT. Para usuários pagantes, a empresa adicionou separadamente um modo thinking, no qual o gerador gasta mais tempo planejando o resultado, pode construir múltiplas variantes e usar ferramentas como busca na web.

Isso explica por que o modelo se sente tão confiante em tarefas onde não é só questão de "desenhar bonito", mas montar um visual a partir de fatos, estrutura e texto. Google tem uma aposta diferente. Nano Banana 2, que é a Gemini 3.

1 Flash Image atualizada, foi anunciada em 26 de fevereiro de 2026 como um híbrido da velocidade do Flash e das capacidades da versão Pro mais poderosa. Os pontos fortes do modelo são iterações rápidas, preservação da semelhança de personagens e edição conveniente de imagens existentes. Dentro do ecossistema Gemini, ele funciona particularmente bem onde o usuário quer refinar rapidamente uma foto, mudar o fundo, montar uma cena a partir de múltiplas referências ou editar sequencialmente uma imagem em conversa.

Mas é precisamente aqui onde a abordagem do Google revelou seu ponto fraco. Em um dos testes, segundo a observação do autor da comparação, o modelo puxou contexto pessoal desnecessário do histórico de conversa, e isso imediatamente deslocou a discussão de "cuja imagem é mais bonita" para uma questão de privacidade. A personalização contextual é uma feature forte do Gemini: em 16 de abril de 2026, Google começou a expandir a geração de imagens levando em conta interesses do usuário e a biblioteca Google Photos.

Porém, quanto mais o sistema sabe sobre o usuário, maior é o custo de um erro se contexto extra de repente acabe no resultado. O diferencial em tal comparação importa não apenas para entusiastas. Se a ferramenta é necessária para layouts de marketing, cartões para redes sociais, infografia, materiais educacionais ou apresentações internas, o vencedor não é quem às vezes cria o frame mais impressionante, mas quem mais frequentemente acerta na primeira tentativa.

Exatamente por isso a vantagem do ChatGPT Images 2.0 parece convincente: o modelo reduz correções manuais e mantém melhor a estrutura de requisições complexas. Se confiarmos na pontuação final do teste, a diferença foi notável — 97% versus 85%.

A conclusão é simples: até o final de abril de 2026, ChatGPT Images 2.0 aparenta ser o gerador universal mais forte para cenários de trabalho onde precisão, texto e previsibilidade importam. Gemini Nano Banana continua sendo uma ferramenta muito rápida e conveniente para edição e visuais personalizados, mas em tarefas onde um erro em uma palavra, legenda ou composição custa uma hora extra de trabalho, a vantagem agora está com a OpenAI.

A competição, porém, está apenas começando: Google já mostrou que consegue alcançar rapidamente em modelos de imagem, o que significa que os próximos meses neste segmento serão particularmente intensos.

ZK
Hamidun News
Notícias de AI sem ruído. Seleção editorial diária de mais de 400 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.

Quer parar de ler sobre IA e começar a usar?

AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.

O que você acha?
Carregando comentários…