Como DeepSeek e Wordstat transformaram a coleta manual de palavras-chave em um sistema de SEO multiagente
Uma tentativa comum de parar de copiar dados do Wordstat para o Excel levou à criação de um pipeline de SEO com DeepSeek, SERP Veto e ensemble voting. O…
Processado por IA de Habr AI; editado por Hamidun News
Um autor no Habr demonstrou como a transferência rotineira de dados do Wordstat para Excel se transformou em uma ferramenta SEO completa com múltiplos agentes, votação de modelos e um árbitro separado. Como resultado, o sistema processa cerca de 3000 palavras-chave em 20–30 minutos, deixando apenas cerca de 5% das consultas disputadas para revisão manual.
Como o pipeline cresceu
Inicialmente, a tarefa era direta: parar de copiar palavras-chave manualmente. A primeira versão do script simplesmente puxava dados do Bukvarix e os salvava em um arquivo. Depois o autor percebeu que para campanhas publicitárias isso não era suficiente: a frequência em tais fontes podia ficar desatualizada em meses, significando que as decisões de orçamento eram baseadas em dados antigos.
Então o sistema adicionou XMLRiver como uma fonte de dados mais fresca do ecossistema Yandex, junto com isso—frequência básica, exata e refinada. Mais tarde, o projeto se afastou do simples parsing em direção a processamento semântico completo. Para clustering, o autor conectou SentenceTransformers, mas rapidamente esbarrou em um problema típico de NLP: consultas semanticamente similares nem sempre devem estar na mesma página.
Para evitar misturar, por exemplo, consultas dependentes de geolocalização como reparos em Moscou e Voronezh, no topo dos embeddings veio SERP Veto—uma verificação de sobreposição de URL nos resultados de busca. Antes disso, a lista ainda era limpa de lixo com regex e colapsada através de deduplicação fuzzy, o que removeu 30–40% dos duplicatas antes de custosos pedidos SERP.
Por que um LLM não é suficiente
Uma vez que a planilha já conseguia reunir, fazer frequência e agrupar palavras-chave, a parte mais desagradável permanecia: filtrar o lixo. Isso significa vagas de emprego, agregadores, consultas com intenção informacional e outros casos extremos que são difíceis de remover com simples palavras negativas. O autor tentou dar a tarefa a um único modelo DeepSeek LLM com um prompt simples, mas logo descobriu que sem contexto o modelo adivinha o nicho muito livremente.
A palavra "reparo" para ele pode significar apartamentos, telefones ou um motor. Para reduzir o caos, um PlannerAgent apareceu antes da classificação. Ele recebe uma descrição do nicho e gera diretrizes para a próxima etapa: quem é o cliente alvo, quais exemplos considerar relevantes, quais armadilhas cortar, como lidar com geografia.
Em paralelo, o autor otimizou o custo: em vez de retornar linhas completas, o modelo começou a responder apenas com IDs de palavras-chave. Isso reduziu o volume de resposta de cerca de 400 para 80 tokens por lote e deu uma economia de 30–40% em grandes execuções.
Por que a votação foi necessária
Mesmo após essas melhorias, o mesmo conjunto de 671 palavras-chave em três execuções mostrou apenas 37,7% de decisões completamente estáveis. A razão se mostrou não estar na temperatura, mas no próprio processo: o PlannerAgent a cada vez mudava ligeiramente os exemplos few-shot, e consultas extremas terminavam em categorias diferentes. Então o autor criou Ensemble Voting: cada lote de 20 palavras-chave é executado três vezes em paralelo, e o resultado é determinado por votação pela maioria. Se as três respostas discordam, a consulta é enviada para a lista "Revisar", e mais tarde é analisada por um agente de arbitragem separado.
- a estabilidade da classificação aumentou de 37,7% para aproximadamente 85%
- a revisão manual foi reduzida para cerca de 5% das consultas
- 3000 palavras-chave são processadas em 20–30 minutos em vez de 3–4 horas
- o custo de uma execução com três votos é de cerca de $0,30
"Corrige três linhas no prompt.
Três linhas. E eu passei uma semana construindo a arquitetura antes disso."
Esta frase captura bem a conclusão principal do autor. Após todo o trabalho arquitetônico, se mostrou que uma consulta comercial óbvia consistentemente terminava na categoria disputada simplesmente porque as regras do prompt não incluíam a frase "chave na mão". Em outras palavras, o esquema multi-agente complexo de fato melhorou a qualidade, mas não eliminou a necessidade básica de validar o próprio prompt em casos extremos antes de decorá-lo com ensembles e árbitros.
O que isso significa
Este caso é útil não apenas para especialistas em SEO. Mostra como a automação aplicada impulsionada pela dor real do usuário pode rapidamente crescer em um sistema de agentes se você atingir os limites de qualidade, custo e instabilidade de saída. E simultaneamente, nos lembra uma verdade mais desconfortável: às vezes o ganho principal não vem de um novo agente, mas de três linhas bem escritas no prompt.
Quer parar de ler sobre IA e começar a usar?
AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.