Habr AI→ original

Desenvolvedor cria agregador de notícias com AI, MCP, DeepSeek e bot no Telegram

O projeto surgiu de uma falta real de atualizações rápidas durante o ataque de drones sobre Dubai em 28 de fevereiro de 2026. O desenvolvedor lançou um…

Processado por IA de Habr AI; editado por Hamidun News
Desenvolvedor cria agregador de notícias com AI, MCP, DeepSeek e bot no Telegram
Fonte: Habr AI. Colagem: Hamidun News.
◐ Ouvir artigo

O motivo para este projeto não foi uma ideia abstrata, mas um problema concreto: em 28 de fevereiro de 2026, o autor estava em Dubai durante a interceptação de drones iranianos e não conseguiu obter rapidamente um quadro completo do que estava acontecendo. Assim nasceu um agregador de notícias multilíngue que coleta notícias, traduz-as, marca-as e entrega não apenas a pessoas, mas também a assistentes de IA.

Como o Projeto Surgiu

O autor descreve o ponto de partida de forma muito pragmática: no Google e Yandex apareciam materiais com duas horas de atraso, enquanto os canais do Telegram forneciam versões conflitantes dos eventos. Quando as notícias são necessárias agora mesmo, tal atraso se transforma de um pequeno incômodo em um problema real.

No início, a solução era simples — um canal no Telegram sobre o Oriente Médio onde fluxos RSS de grandes agências de notícias mundiais eram coletados manualmente. Mas o modo manual logo atingiu um limite de volume. O fluxo cresceu para mais de 200 publicações por dia, e mantê-lo sem automação se tornou sem sentido. Então veio um parser, depois tradução automática, depois foram adicionadas fontes de TI e pautas econômicas. No final, uma ideia local de um canal operacional se transformou em um produto completo: um site agregador de notícias com feed, chat de IA, API, servidor MCP e um bot separado no Telegram.

O Que Há Dentro do Sistema

O projeto é construído como um conjunto de componentes independentes, não como um monólito. Um serviço separado FeedManager obtém RSS, processa feeds e escreve dados em MySQL. A parte Flask lê artigos já processados e não depende de o parser ter travado em alguma fonte instável. A anotação automática de tags funciona como um processo independente: lê materiais frescos do banco de dados e escreve resultados de volta, enquanto o bot do Telegram responde aos usuários em seu próprio loop.

  • 80+ fontes em um único fluxo, incluindo agências de notícias internacionais, mídia de TI e publicações comerciais
  • 9 categorias temáticas e cerca de 50 tags para navegação do feed
  • tradução automática de materiais para o russo imediatamente após a publicação
  • API REST com busca, filtros por tags, datas e fontes
  • servidor MCP que permite que assistentes de IA trabalhem com o banco de dados de notícias como uma ferramenta

No topo do agregador fica uma API e servidor MCP para clientes externos e agentes de IA. Um detalhe chave é não apenas saída bruta de JSON, mas respostas estruturadas através de modelos Pydantic como ArticleSummary e SearchResult. Isso reduz erros no processamento e economiza tokens. De acordo com o plano do autor, um assistente pode encontrar a tag certa por conta própria, solicitar artigos dos últimos dias, ler textos completos e compilar um resumo sem preparação manual de dados. As ferramentas são coletadas dinamicamente a cada cinco minutos, então novos recursos podem ser adicionados sem reescrever a lógica do agente.

Por Que Não Muita IA

IA neste projeto não é usada em todos os lugares, apenas onde realmente compensa. Para a interface de chat, DeepSeek foi escolhido: de acordo com o autor, é 15–30 vezes mais barato que alternativas enquanto oferece qualidade comparável para busca e sumarização de notícias. Para um produto gratuito, isso é crítico. O mesmo pragmatismo é evidente em como as traduções são armazenadas: versões multilíngues de um artigo ficam diretamente em um campo JSON do registro, o que acelera o acesso e simplifica o dimensionamento para novos idiomas.

O compromisso mais revelador é a anotação automática de tags. Em vez de um LLM, o autor usou correspondência de palavras-chave em 47 tópicos e cerca de 600 palavras-chave em inglês e russo. Esta abordagem obtém cerca de 85% de precisão, funciona em menos de um milissegundo por artigo e não consome tokens. Diante do entusiasmo universal por "encaixar uma rede neural em cada etapa", isso parece uma posição madura de engenharia: IA é necessária onde agrega valor, não apenas porque parece moderno.

O Que Isso Significa

Este caso mostra claramente que um produto de IA de notícias hoje não é apenas um modelo que sabe parafrasear textos. Valor real aparece onde há coleta confiável de dados, estrutura adequada, uma API clara e um protocolo como MCP para conectar assistentes. Para mídia, equipes de pesquisa e serviços de análise internos, este é um sinal: de um feed comum você pode construir uma infraestrutura funcional para resumos ao vivo, busca e respostas automatizadas.

ZK
Hamidun News
Notícias de AI sem ruído. Seleção editorial diária de mais de 400 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.

Quer parar de ler sobre IA e começar a usar?

AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.

O que você acha?
Carregando comentários…