Comment nous travaillons
Le pipeline complet de Hamidun News — de la collecte RSS à la publication en 6 langues — et les contrôles qualité à chaque étape.
01
Pipeline
Collecte RSS+SPA toutes les 30 min → préfiltre Haiku (4 workers en parallèle) → notation de la qualité → réécriture Haiku (version courte 250–400 mots, complète 800–1 500) → couverture Gemini → traduction en 5 langues → créneau éditorial de publication → chaîne Telegram + portail + mini app.
02
Contrôles qualité
pre_filter_score— pertinence et qualité thématique (verdict de Haiku).quality_score— contrôle post-réécriture (regex de translittération, vérification de longueur, une nouvelle tentative puis rétrogradation).is_duplicate_of— déduplication sémantique inter-langues (chevauchement d'entités nommées dans une fenêtre de 6 heures).- Un délai d'1 heure après approbation avant la promotion dans le bot — laisse les réactions des lecteurs émerger.
03
Langues
- Le russe est la source de vérité (humains + Haiku).
- 5 traductions (en/es/pt/fr/ar) via Gemini 2.5 Flash avec nouvelle tentative si le corps est vide.
- Les articles non traduits reçoivent noindex,follow dans cette langue et sortent des clusters hreflang.
04
Transparence algorithmique
- Le bot Telegram livre le top-8 par 24 h selon quality_score (le paramètre BOT_TOP_N_PER_24H).
- La page d'accueil du portail affiche du plus récent au plus ancien avec des puces de catégories ; les utilisateurs connectés reçoivent un rail personnalisé « Pour vous » (affinité anonyme par clics de catégories).
- Nous ne mettons pas en avant de contenu payant. Nous ne rétrogradons pas les concurrents.