Habr AI→ original

Desarrollador crea agregador de noticias con AI, MCP, DeepSeek y bot de Telegram

El proyecto surgió por una falta real de actualizaciones rápidas durante el ataque de drones sobre Dubái del 28 de febrero de 2026. El desarrollador lanzó un…

Procesado por IA desde Habr AI; editado por Hamidun News
Desarrollador crea agregador de noticias con AI, MCP, DeepSeek y bot de Telegram
Fuente: Habr AI. Collage: Hamidun News.
◐ Escuchar artículo

La razón de este proyecto no fue una idea abstracta, sino un problema concreto: el 28 de febrero de 2026, el autor se encontraba en Dubái durante la interceptación de drones iraníes y no pudo obtener rápidamente una visión completa de lo que estaba sucediendo. Así nació un agregador de noticias multilingüe que recopila noticias, las traduce, las etiqueta y las entrega no solo a personas, sino también a asistentes de IA.

Cómo Surgió el Proyecto

El autor describe el punto de partida de forma muy pragmática: en Google y Yandex aparecían materiales con dos horas de antigüedad, mientras que los canales de Telegram ofrecían versiones contradictorias de los eventos. Cuando las noticias se necesitan ahora mismo, tal retraso se convierte de una pequeña molestia en un problema real.

Al principio, la solución era simple: un canal de Telegram sobre Oriente Medio donde se recopilaban manualmente flujos RSS de grandes agencias de noticias mundiales. Pero el modo manual pronto alcanzó un límite de volumen. El flujo creció a más de 200 publicaciones al día, y mantenerlo sin automatización se volvió sin sentido. Luego vino un parser, después traducción automática, luego se añadieron fuentes de TI y temas económicos. Al final, una idea local de un canal operativo se transformó en un producto completo: un sitio agregador de noticias con feed, chat de IA, API, servidor MCP y un bot separado en Telegram.

Qué Hay Dentro del Sistema

El proyecto se construye como un conjunto de componentes independientes, no como un monolito. Un servicio separado FeedManager obtiene RSS, procesa feeds y escribe datos en MySQL. La parte Flask lee artículos ya procesados y no depende de si el parser se quedó atascado en alguna fuente inestable. La anotación automática de etiquetas funciona como un proceso independiente: lee materiales frescos de la base de datos y escribe resultados de vuelta, mientras que el bot de Telegram responde a los usuarios en su propio bucle.

  • 80+ fuentes en un único flujo, incluidas agencias de noticias internacionales, medios de TI y publicaciones comerciales
  • 9 categorías temáticas y alrededor de 50 etiquetas para navegar por el feed
  • traducción automática de materiales al ruso inmediatamente después de la publicación
  • API REST con búsqueda, filtros por etiquetas, fechas y fuentes
  • servidor MCP que permite que los asistentes de IA trabajen con la base de datos de noticias como una herramienta

En la parte superior del agregador hay una API y servidor MCP para clientes externos y agentes de IA. Un detalle clave es no solo salida JSON sin procesar, sino respuestas estructuradas a través de modelos Pydantic como ArticleSummary y SearchResult. Esto reduce errores en el procesamiento y ahorra tokens. Según el plan del autor, un asistente puede encontrar la etiqueta correcta por su cuenta, solicitar artículos de los últimos días, leer textos completos y compilar un resumen sin preparación manual de datos. Las herramientas se recogen dinámicamente cada cinco minutos, por lo que se pueden añadir nuevas funciones sin reescribir la lógica del agente.

Por Qué No Demasiada IA

La IA en este proyecto no se usa en todas partes, solo donde realmente vale la pena. Para la interfaz de chat, se eligió DeepSeek: según el autor, es 15–30 veces más barato que las alternativas mientras ofrece calidad comparable para búsqueda y resumen de noticias. Para un producto gratuito, esto es crítico. El mismo pragmatismo es evidente en cómo se almacenan las traducciones: las versiones multilingües de un artículo se encuentran directamente en un campo JSON del registro, lo que acelera el acceso y simplifica el escalado a nuevos idiomas.

El compromiso más revelador es la anotación automática de etiquetas. En lugar de un LLM, el autor utilizó coincidencia de palabras clave en 47 temas y alrededor de 600 palabras clave en inglés y ruso. Este enfoque logra alrededor del 85% de precisión, se ejecuta en menos de un milissegundo por artículo y no consume tokens. Frente al entusiasmo universal por "enchufar una red neuronal en cada paso", esto parece una posición de ingeniería madura: la IA es necesaria donde añade valor, no solo porque se ve moderno.

Qué Significa Esto

Este caso muestra claramente que un producto de IA de noticias hoy no es solo un modelo que sabe parafrasear textos. El valor real aparece donde hay recopilación confiable de datos, estructura adecuada, una API clara y un protocolo como MCP para conectar asistentes. Para medios, equipos de investigación y servicios de análisis internos, esta es una señal: de un feed ordinario puede construir una infraestructura funcional para resúmenes en vivo, búsqueda y respuestas automatizadas.

ZK
Hamidun News
Noticias de AI sin ruido. Selección editorial diaria de más de 400 fuentes. Producto de Zhemal Khamidun, Head of AI en Alpina Digital.

¿Quieres dejar de leer sobre IA y empezar a usarla?

AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.

¿Qué te parece?
Cargando comentarios…