Google apresenta DiffusionGemma — modelo com abordagem alternativa para geração de texto

Google lançou DiffusionGemma — um modelo de IA experimental que difere fundamentalmente dos chatbots modernos. Em vez da abordagem de transformer convencional, ele utiliza um mecanismo de difusão emprestado da geração de imagens. Isso abre novas possibilidades na velocidade e eficiência do processamento de texto.

Khamidun Zhemal

Monitoramento de AI · 3DNews AI

11 de jun. de 2026· 2 min

Processado por IA de 3DNews AI; editado por Hamidun News

Google apresenta DiffusionGemma — modelo com abordagem alternativa para geração de texto — Fonte: 3DNews AI. Colagem: Hamidun News.

◐ Ouvir artigo

Google lançou um modelo experimental chamado DiffusionGemma, que demonstra uma abordagem fundamentalmente diferente para geração de texto em comparação com modelos que fundamentam os chatbots modernos.

Como Funcionam os Chatbots Atualmente

Modelos modernos de IA para texto (GPT, Claude, Gemini) usam arquitetura de transformador. Seu princípio é simples: o modelo processa texto da esquerda para a direita e prevê a próxima palavra uma de cada vez. É como escrever texto no escuro — um caractere após o outro, sem possibilidade de desfazer passos anteriores. Este esquema funciona impecavelmente e tornou-se o padrão da indústria nos últimos três anos. No entanto, tem uma limitação incorporada: o modelo não pode voltar e reconsiderar sua decisão. Após cada token ser gerado, o contexto apenas se move para frente. Se o modelo cometeu um erro no 50º token, não pode corrigi-lo.

A Abordagem de Difusão do DiffusionGemma

DiffusionGemma usa uma lógica completamente diferente — um processo de difusão que Google tomou emprestado da geração de imagens. Lá ele mostrou excelentes resultados há muito tempo (DALL-E, Midjourney, Stable Diffusion funcionam assim). Em um modelo de difusão, tudo acontece não sequencialmente, mas iterativamente.

O modelo começa com ruído aleatório em toda a extensão do texto simultaneamente. Na primeira iteração, aparecem contornos grosseiros de significado. Na segunda, as estruturas sintáticas são refinadas.

Na terceira, detalhes estilísticos são adicionados. É semelhante a como um artista trabalha: primeiro um esboço a carvão, depois cores principais, depois luz e sombra, depois pinceladas finais. A diferença-chave: em cada passo da geração de difusão, o modelo pode revisar e corrigir todo o texto de uma vez, em vez de apenas selecionar a próxima palavra no final.

Por Que Isso É Teoricamente Melhor

À primeira vista, a abordagem do transformador parece mais eficiente: por que fazer múltiplas iterações se você pode gerar em uma única passagem? Mas a pesquisa mostra algo inesperado. O processo de difusão oferece aos modelos duas vantagens fundamentais:

Reavaliação de contexto — em cada iteração, o modelo pode alterar decisões que tomou anteriormente
Paralelismo — as atualizações de texto ocorrem em toda a extensão simultaneamente, em vez de token por token
Menos contradições internas — o modelo vê o texto inteiro holisticamente e pode reconciliar logicamente diferentes partes
Novo paradigma de pesquisa — uma questão aberta sobre quais arquiteturas são possíveis em NLP

Na prática, os modelos de difusão podem funcionar mais rápido em algumas tarefas graças ao paralelismo. Em vez de aguardar o token N antes de começar a refinar as posições N+1 até N+50, o sistema pode melhorá-las todas simultaneamente.

Status: Laboratório, Não Produção

DiffusionGemma não é um substituto para ChatGPT. É um modelo de pesquisa que Google lançou como código aberto para experimentação da comunidade. Os resultados atualmente ficam atrás dos recordistas de transformadores em benchmarks padrão. No entanto, é o primeiro desafio sério ao monopólio da arquitetura de transformador. Pesquisadores do Google observam promessa particular na abordagem de difusão para tarefas que exigem processamento lógico profundo: inferência multietapas, raciocínio complexo, escrita criativa com consistência interna.

O Que Isso Significa

Google está enviando um sinal claro: o paradigma de 'transformador é o único caminho correto' está incompleto. Existem arquiteturas alternativas que poderiam se tornar competitivas e até superiores em domínios específicos. A direção provável do desenvolvimento é modelos híbridos que combinam a velocidade do transformador com a capacidade de processamento profundo de informações do modelo de difusão.

Hamidun News

Notícias de AI sem ruído. Seleção editorial diária de mais de 50 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.

Canal do Telegram RSS hamidun.com

Precisa de IA funcionando dentro da sua empresa — não só no feed de notícias?

Eu construo IA em produção para empresas — CRM sob medida, ferramentas internas, agentes autônomos, automação de processos. Pertence a você, moldada ao seu processo, sem taxa por usuário. Feito por Zhemal Khamidun, CPO da AlpinaGPT (plataforma de IA, 6.000+ usuários).

Agendar consultoria grátis →