Cómo trabajamos
El pipeline completo de Hamidun News — de la recolección RSS a la publicación en 6 idiomas — y los controles de calidad en cada paso.
01
Pipeline
Recolección RSS+SPA cada 30 min → prefiltro Haiku (4 workers en paralelo) → puntuación de calidad → reescritura con Haiku (versión corta 250–400 palabras, completa 800–1.500) → portada con Gemini → traducción a 5 idiomas → franja editorial de publicación → canal de Telegram + portal + mini app.
02
Controles de calidad
pre_filter_score— relevancia y calidad temática (veredicto de Haiku).quality_score— control posterior a la reescritura (regex de transliteración, comprobación de longitud, un reintento y luego degradación).is_duplicate_of— deduplicación semántica entre idiomas (solapamiento de entidades nombradas en una ventana de 6 horas).- Retraso de 1 hora tras la aprobación antes de la promoción en el bot — deja aflorar las reacciones de los lectores.
03
Idiomas
- El ruso es la fuente de la verdad (humanos + Haiku).
- 5 traducciones (en/es/pt/fr/ar) vía Gemini 2.5 Flash con reintento si el cuerpo llega vacío.
- Los artículos sin traducir reciben noindex,follow en ese idioma y se excluyen de los clústeres hreflang.
04
Transparencia algorítmica
- El bot de Telegram entrega el top-8 por 24 h según quality_score (el parámetro BOT_TOP_N_PER_24H).
- La portada del portal muestra lo más nuevo primero con chips de categoría; los usuarios con sesión reciben una fila personalizada «Para ti» (afinidad anónima por clics en categorías).
- No impulsamos contenido pagado. No degradamos a competidores.