Google enseñó a la AI a predecir inundaciones a partir de antiguos reportajes periodísticos
Google usa antiguos reportajes periodísticos y LLM para predecir inundaciones repentinas. Los textos de archivo se convierten en datos numéricos, lo que…
Procesado por IA desde TechCrunch; editado por Hamidun News
Google ha desarrollado un enfoque no convencional para predecir inundaciones repentinas: en lugar de infraestructura cara de sensores, la empresa utiliza reportajes de noticias archivadas como fuente de datos históricos. Un modelo de lenguaje convierte descripciones textuales cualitativas de desastres naturales en métricas cuantitativas adecuadas para entrenar modelos hidrológicos. El problema que este método resuelve es bien conocido por los climatólogos.
Los modelos precisos de predicción de inundaciones requieren series de datos de varios años sobre niveles de agua, precipitación y topografía. Pero en la mayoría de los países en desarrollo, donde las inundaciones son más mortales, tal infraestructura simplemente no existe. Los sensores cuestan dinero, requieren mantenimiento y electricidad — todo lo cual escasea en las regiones vulnerables.
Sin embargo, la información histórica sobre inundaciones sí existe — en archivos de periódicos, reportajes de publicaciones locales y comunicados del gobierno. El problema es que estos datos son cualitativos: "una inundación severa anegó tres pueblos" — este no es un número con el que pueda trabajar un modelo tradicional. Google propuso usar un LLM como traductor: el modelo lee texto histórico y extrae de él estimaciones numéricas estructuradas de la escala, duración y geografía del evento.
Las series numéricas sintéticas resultantes se utilizan entonces para entrenar un modelo de predicción de inundaciones. Esencialmente, el periodismo de archivo se convierte en sustituto de décadas de mediciones instrumentales. Esta es una forma fundamentalmente nueva de abordar la escasez de datos en tareas climáticas — un enfoque potencialmente aplicable mucho más allá de la hidrología.
Google ya está probando el sistema en regiones de África y Asia del Sur, donde las advertencias de inundaciones son prácticamente inexistentes. La empresa ha estado desarrollando su iniciativa Flood Hub desde 2023, cubriendo actualmente más de 80 países. El nuevo método debería expandir la cobertura a territorios que previamente permanecieron fuera del área de pronóstico debido a la ausencia de datos numéricos históricos.
Este es un ejemplo ilustrativo de cómo los LLM están cambiando la estructura misma de los datos científicos. Anteriormente, la frontera entre "tener datos" y "no tener datos" estaba determinada por la disponibilidad de equipos de medición. Ahora esa frontera puede retrocederse usando modelos de lenguaje que pueden extraer información cuantitativa oculta de textos escritos sin propósito científico alguno.
¿Quieres dejar de leer sobre IA y empezar a usarla?
AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.