Comment nous travaillons

Le pipeline complet de Hamidun News — de la collecte RSS à la publication en 6 langues — et les contrôles qualité à chaque étape.

01

Pipeline

Collecte RSS+SPA toutes les 30 min → préfiltre Haiku (4 workers en parallèle) → notation de la qualité → réécriture Haiku (version courte 250–400 mots, complète 800–1 500) → couverture Gemini → traduction en 5 langues → créneau éditorial de publication → chaîne Telegram + portail + mini app.

02

Contrôles qualité

  • pre_filter_score — pertinence et qualité thématique (verdict de Haiku).
  • quality_score — contrôle post-réécriture (regex de translittération, vérification de longueur, une nouvelle tentative puis rétrogradation).
  • is_duplicate_of — déduplication sémantique inter-langues (chevauchement d'entités nommées dans une fenêtre de 6 heures).
  • Un délai d'1 heure après approbation avant la promotion dans le bot — laisse les réactions des lecteurs émerger.
03

Langues

  • Le russe est la source de vérité (humains + Haiku).
  • 5 traductions (en/es/pt/fr/ar) via Gemini 2.5 Flash avec nouvelle tentative si le corps est vide.
  • Les articles non traduits reçoivent noindex,follow dans cette langue et sortent des clusters hreflang.
04

Transparence algorithmique

  • Le bot Telegram livre le top-8 par 24 h selon quality_score (le paramètre BOT_TOP_N_PER_24H).
  • La page d'accueil du portail affiche du plus récent au plus ancien avec des puces de catégories ; les utilisateurs connectés reçoivent un rail personnalisé « Pour vous » (affinité anonyme par clics de catégories).
  • Nous ne mettons pas en avant de contenu payant. Nous ne rétrogradons pas les concurrents.