Como Gemini levou o blog de IA ao mode collapse e forçou a reconstrução do gerador de temas
O prompt aberto para geração de temas no blog de IA silenciosamente caiu em mode collapse: por quatro sextas-feiras seguidas, o LLM sugeriu a mesma pergunta…
Processado por IA de Habr AI; editado por Hamidun News
Um prompt criativo aberto provou ser um editor ruim: em vez de diversidade, ele sutilmente levou a coluna de sexta-feira do blog de IA para um colapso de modo. Quatro semanas seguidas, o LLM oferecia essencialmente a mesma "questão controversa sobre IA", alterando apenas ligeiramente a formulação, e isso só ficou visível quando os textos semanticamente idênticos formaram uma sequência. O problema não surgiu imediatamente precisamente porque cada publicação individual parecia aceitável.
Na primeira semana o tópico parecia apropriado, na segunda—apenas parecido, na terceira a repetição podia ser atribuída a coincidência, mas na quarta ficou claro: o modelo não procurava novos ângulos mas circulava o mesmo padrão. Para uma equipe editorial este é um tipo particularmente desagradável de falha, pois localmente a qualidade é preservada enquanto sistemicamente o conteúdo começa a se duplicar. Inicialmente, soluções foram procuradas no próprio prompt.
A lógica era clara: se o modelo ficou preso em uma tese, então requisitos de diversidade mais rigorosos, restrições, pedidos por novas perspectivas ou proibições de repetições eram necessários. Mas tais medidas ajudaram apenas cosmeticamente. Formulações mudavam, tom se deslocava, mas a ideia central permanecia a mesma.
Esta é uma observação importante para qualquer pessoa que use LLM em pipelines de conteúdo: um pedido aberto para "inventar um tópico interessante" não garante diversidade real, mesmo que as respostas pareçam frescas. No curso da investigação, descobriu-se que parte do problema não apenas estava na engenharia de prompt mas também na própria configuração do Gemini. Esta camada inicialmente caiu fora de vista, embora afete diretamente a distribuição de respostas e a tendência do modelo de repetir templates seguros.
Em tais sistemas, um erro raramente vive em um único lugar: o prompt, parâmetros de geração e a lógica geral do pipeline se reforçam mutuamente. Portanto, tentar "consertar" tudo com uma formulação mágica geralmente apenas mascara o sintoma mas não remove a causa. A situação também revelou outro problema prático da automação editorial: a revisão manual padrão não detecta tais falhas se olhando materiais um a um.
O que é necessário é controle ao nível da série—comparar tópicos ao longo de um mês, verificar proximidade semântica, um registro de ângulos já publicados e pelo menos uma métrica simples de diversidade. Caso contrário o modelo produzirá textos "normais" que em conjunto desfocam a coluna e criam a impressão de que o blog repetidamente se discute sobre uma questão. Após quatro rodadas de experimentos, a equipe chegou a uma conclusão mais pragmática: a tarefa de geração de tópicos é melhor não deixada inteiramente ao critério do modelo.
Em vez de um aberto "invente uma questão", o gerador foi comutado para rotação determinística de um pool de tópicos pré-montado e editado. Esta abordagem é menos eficaz do ponto de vista de "criatividade", mas entrega o que a equipe editorial realmente precisa—cobertura previsível de diferentes histórias, ausência de looping e controle sobre balanço temático. E o conserto não exigiu fine-tuning, RAG ou migração para outro modelo.
A principal conclusão aqui é clara: se um LLM está incorporado em um processo editorial regular, deve ser avaliado não por uma única resposta bem-sucedida mas por uma série de lançamentos. O colapso de modo em tarefas aplicadas frequentemente não se parece com uma falha aguda mas como um estreitamento gradual do leque de ideias, notável apenas à distância. Portanto para geradores de rúbricas, geradores de tópicos e outros cenários recorrentes, mais confiável que a liberdade máxima do modelo é uma combinação de listas curadas, rotação rigorosa e verificações periódicas por repetição semântica—e decisões são melhor tomadas antecipadamente, antes que a repetição se torne um hábito editorial entrincheirado.
Quer parar de ler sobre IA e começar a usar?
AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.