Habr AI→ original

Como DeepSeek e Wordstat transformaram a coleta manual de palavras-chave em um sistema de SEO multiagente

Uma tentativa comum de parar de copiar dados do Wordstat para o Excel levou à criação de um pipeline de SEO com DeepSeek, SERP Veto e ensemble voting. O…

Processado por IA de Habr AI; editado por Hamidun News
Como DeepSeek e Wordstat transformaram a coleta manual de palavras-chave em um sistema de SEO multiagente
Fonte: Habr AI. Colagem: Hamidun News.
◐ Ouvir artigo

Um autor no Habr demonstrou como a transferência rotineira de dados do Wordstat para Excel se transformou em uma ferramenta SEO completa com múltiplos agentes, votação de modelos e um árbitro separado. Como resultado, o sistema processa cerca de 3000 palavras-chave em 20–30 minutos, deixando apenas cerca de 5% das consultas disputadas para revisão manual.

Como o pipeline cresceu

Inicialmente, a tarefa era direta: parar de copiar palavras-chave manualmente. A primeira versão do script simplesmente puxava dados do Bukvarix e os salvava em um arquivo. Depois o autor percebeu que para campanhas publicitárias isso não era suficiente: a frequência em tais fontes podia ficar desatualizada em meses, significando que as decisões de orçamento eram baseadas em dados antigos.

Então o sistema adicionou XMLRiver como uma fonte de dados mais fresca do ecossistema Yandex, junto com isso—frequência básica, exata e refinada. Mais tarde, o projeto se afastou do simples parsing em direção a processamento semântico completo. Para clustering, o autor conectou SentenceTransformers, mas rapidamente esbarrou em um problema típico de NLP: consultas semanticamente similares nem sempre devem estar na mesma página.

Para evitar misturar, por exemplo, consultas dependentes de geolocalização como reparos em Moscou e Voronezh, no topo dos embeddings veio SERP Veto—uma verificação de sobreposição de URL nos resultados de busca. Antes disso, a lista ainda era limpa de lixo com regex e colapsada através de deduplicação fuzzy, o que removeu 30–40% dos duplicatas antes de custosos pedidos SERP.

Por que um LLM não é suficiente

Uma vez que a planilha já conseguia reunir, fazer frequência e agrupar palavras-chave, a parte mais desagradável permanecia: filtrar o lixo. Isso significa vagas de emprego, agregadores, consultas com intenção informacional e outros casos extremos que são difíceis de remover com simples palavras negativas. O autor tentou dar a tarefa a um único modelo DeepSeek LLM com um prompt simples, mas logo descobriu que sem contexto o modelo adivinha o nicho muito livremente.

A palavra "reparo" para ele pode significar apartamentos, telefones ou um motor. Para reduzir o caos, um PlannerAgent apareceu antes da classificação. Ele recebe uma descrição do nicho e gera diretrizes para a próxima etapa: quem é o cliente alvo, quais exemplos considerar relevantes, quais armadilhas cortar, como lidar com geografia.

Em paralelo, o autor otimizou o custo: em vez de retornar linhas completas, o modelo começou a responder apenas com IDs de palavras-chave. Isso reduziu o volume de resposta de cerca de 400 para 80 tokens por lote e deu uma economia de 30–40% em grandes execuções.

Por que a votação foi necessária

Mesmo após essas melhorias, o mesmo conjunto de 671 palavras-chave em três execuções mostrou apenas 37,7% de decisões completamente estáveis. A razão se mostrou não estar na temperatura, mas no próprio processo: o PlannerAgent a cada vez mudava ligeiramente os exemplos few-shot, e consultas extremas terminavam em categorias diferentes. Então o autor criou Ensemble Voting: cada lote de 20 palavras-chave é executado três vezes em paralelo, e o resultado é determinado por votação pela maioria. Se as três respostas discordam, a consulta é enviada para a lista "Revisar", e mais tarde é analisada por um agente de arbitragem separado.

  • a estabilidade da classificação aumentou de 37,7% para aproximadamente 85%
  • a revisão manual foi reduzida para cerca de 5% das consultas
  • 3000 palavras-chave são processadas em 20–30 minutos em vez de 3–4 horas
  • o custo de uma execução com três votos é de cerca de $0,30
"Corrige três linhas no prompt.

Três linhas. E eu passei uma semana construindo a arquitetura antes disso."

Esta frase captura bem a conclusão principal do autor. Após todo o trabalho arquitetônico, se mostrou que uma consulta comercial óbvia consistentemente terminava na categoria disputada simplesmente porque as regras do prompt não incluíam a frase "chave na mão". Em outras palavras, o esquema multi-agente complexo de fato melhorou a qualidade, mas não eliminou a necessidade básica de validar o próprio prompt em casos extremos antes de decorá-lo com ensembles e árbitros.

O que isso significa

Este caso é útil não apenas para especialistas em SEO. Mostra como a automação aplicada impulsionada pela dor real do usuário pode rapidamente crescer em um sistema de agentes se você atingir os limites de qualidade, custo e instabilidade de saída. E simultaneamente, nos lembra uma verdade mais desconfortável: às vezes o ganho principal não vem de um novo agente, mas de três linhas bem escritas no prompt.

ZK
Hamidun News
Notícias de AI sem ruído. Seleção editorial diária de mais de 400 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.

Quer parar de ler sobre IA e começar a usar?

AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.

O que você acha?
Carregando comentários…