Habr AI→ original

Un développeur crée un agrégateur d'actualités avec AI, MCP, DeepSeek et un bot Telegram

Le projet est né d'un manque réel d'informations rapides pendant l'attaque de drones au-dessus de Dubaï le 28 février 2026. Le développeur a lancé un…

Traité par IA depuis Habr AI ; édité par Hamidun News
Un développeur crée un agrégateur d'actualités avec AI, MCP, DeepSeek et un bot Telegram
Source : Habr AI. Collage: Hamidun News.
◐ Écouter l'article

La raison de ce projet n'était pas une idée abstraite, mais un problème concret : le 28 février 2026, l'auteur se trouvait à Dubaï lors de l'interception de drones iraniens et n'a pas pu obtenir rapidement une image complète de ce qui se passait. Ainsi est né un agrégateur de nouvelles multilingue qui collecte des nouvelles, les traduit, les étiquette et les livre non seulement aux gens, mais aussi aux assistants IA.

Comment le Projet Est Apparu

L'auteur décrit le point de départ de manière très pragmatique : sur Google et Yandex, on trouvait des matériaux vieux de deux heures, tandis que les canaux Telegram fournissaient des versions contradictoires des événements. Quand les nouvelles sont nécessaires maintenant, un tel délai se transforme d'une petite gêne en un vrai problème.

Au départ, la solution était simple : un canal Telegram sur le Moyen-Orient où les flux RSS des grandes agences de presse mondiales étaient collectés manuellement. Mais le mode manuel a rapidement atteint un plafond de volume. Le flux a augmenté à plus de 200 publications par jour, et le maintenir sans automatisation est devenu sans sens. Puis vint un parser, puis la traduction automatique, puis ont été ajoutées des sources informatiques et des sujets économiques. Finalement, une idée locale d'un canal opérationnel s'est transformée en un produit complet : un site agrégateur de nouvelles avec un fil, un chat IA, une API, un serveur MCP et un bot Telegram séparé.

Ce Qu'il y a à l'Intérieur du Système

Le projet est construit comme un ensemble de composants indépendants, pas comme un monolithe. Un service séparé FeedManager récupère RSS, traite les flux et écrit les données dans MySQL. La partie Flask lit des articles déjà traités et ne dépend pas de si le parser s'est bloqué sur une source instable quelconque. L'annotation automatique des tags fonctionne comme un processus indépendant : elle lit les matériaux frais de la base de données et écrit les résultats, tandis que le bot Telegram répond aux utilisateurs dans sa propre boucle.

  • 80+ sources dans un seul flux, incluant les agences de presse internationales, les médias informatiques et les publications commerciales
  • 9 catégories thématiques et environ 50 tags pour naviguer dans le flux
  • traduction automatique des matériaux en russe immédiatement après la publication
  • API REST avec recherche, filtres par tags, dates et sources
  • serveur MCP qui permet aux assistants IA de travailler avec la base de données de nouvelles comme un outil

Au-dessus de l'agrégateur se trouvent une API et un serveur MCP pour les clients externes et les agents IA. Un détail clé est non seulement une sortie JSON brute, mais des réponses structurées via des modèles Pydantic comme ArticleSummary et SearchResult. Cela réduit les erreurs de traitement et économise les tokens. Selon le plan de l'auteur, un assistant peut trouver le bon tag par lui-même, demander des articles des derniers jours, lire les textes complets et compiler un résumé sans préparation manuelle des données. Les outils sont récupérés dynamiquement tous les cinq minutes, donc de nouvelles fonctionnalités peuvent être ajoutées sans réécrire la logique de l'agent.

Pourquoi Pas Trop d'IA

L'IA dans ce projet n'est pas utilisée partout, seulement où elle en vaut vraiment la peine. Pour l'interface de chat, DeepSeek a été choisi : selon l'auteur, il est 15–30 fois moins cher que les alternatives tout en offrant une qualité comparable pour la recherche et la synthèse de nouvelles. Pour un produit gratuit, c'est critique. Le même pragmatisme est évident dans la façon dont les traductions sont stockées : les versions multilingues d'un article se trouvent directement dans un champ JSON de l'enregistrement, ce qui accélère l'accès et simplifie le passage à l'échelle vers de nouvelles langues.

Le compromis le plus révélateur est l'annotation automatique des tags. Au lieu d'un LLM, l'auteur a utilisé la correspondance de mots-clés sur 47 sujets et environ 600 mots-clés en anglais et russe. Cette approche donne environ 85% de précision, s'exécute en moins d'une milliseconde par article et ne consomme aucun token. Dans un contexte d'enthousiasme universel pour « brancher un réseau neuronal à chaque étape », cela ressemble à une position d'ingénierie mûre : l'IA est nécessaire là où elle ajoute de la valeur, pas simplement parce qu'elle a l'air moderne.

Ce Que Cela Signifie

Ce cas montre clairement qu'un produit IA de nouvelles aujourd'hui n'est pas simplement un modèle qui sait paraphraser des textes. La vraie valeur apparaît là où il y a une collecte fiable de données, une structure appropriée, une API claire et un protocole comme MCP pour connecter les assistants. Pour les médias, les équipes de recherche et les services d'analyse interne, c'est un signal : à partir d'un flux ordinaire, vous pouvez construire une infrastructure fonctionnelle pour des résumés en direct, la recherche et les réponses automatisées.

ZK
Hamidun News
Actualités IA sans bruit. Sélection éditoriale quotidienne de plus de 400 sources. Produit de Zhemal Khamidun, Head of AI chez Alpina Digital.

Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?

AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.

Qu'en pensez-vous ?
Chargement des commentaires…