Google a appris à l’AI à prévoir les inondations à partir d’anciens reportages de presse
Google utilise d’anciens reportages de presse et un LLM pour prévoir les crues soudaines. Les textes d’archives sont convertis en données numériques, ce qui…
Traité par IA depuis TechCrunch ; édité par Hamidun News
Google a développé une approche non conventionnelle pour prédire les crues soudaines : au lieu d'une infrastructure coûteuse de capteurs, l'entreprise utilise des rapports de presse archivés comme source de données historiques. Un modèle de langage convertit les descriptions textuelles qualitatives de catastrophes naturelles en métriques quantitatives appropriées pour entraîner des modèles hydrologiques. Le problème que cette méthode résout est bien connu des climatologues.
Les modèles précis de prévision des crues exigent des séries de données sur plusieurs années concernant les niveaux d'eau, les précipitations et la topographie. Mais dans la plupart des pays en développement, où les crues sont les plus meurtrières, une telle infrastructure n'existe simplement pas. Les capteurs coûtent cher, nécessitent un entretien et de l'électricité — tout cela fait défaut dans les régions vulnérables.
Pourtant, des informations historiques sur les crues existent bel et bien — dans les archives de journaux, les rapports de publications locales et les communiqués gouvernementaux. Le problème est que ces données sont qualitatives : « une crue importante a inondé trois villages » — ce n'est pas un chiffre avec lequel un modèle traditionnel peut travailler. Google a proposé d'utiliser un LLM comme traducteur : le modèle lit le texte historique et en extrait des estimations numériques structurées de l'ampleur, la durée et la géographie de l'événement.
Les séries numériques synthétiques obtenues sont ensuite utilisées pour entraîner un modèle de prévision des crues. Essentiellement, le journalisme d'archive devient un substitut aux décennies de mesures instrumentales. C'est une façon fondamentalement nouvelle d'aborder la pénurie de données dans les tâches climatiques — une approche potentiellement applicable bien au-delà de l'hydrologie.
Google teste déjà le système dans les régions d'Afrique et d'Asie du Sud, où les avertissements de crues sont pratiquement inexistants. L'entreprise développe son initiative Flood Hub depuis 2023, couvrant actuellement plus de 80 pays. La nouvelle méthode devrait étendre la couverture aux territoires qui précédemment restaient en dehors de la zone de prévision en raison de l'absence de données numériques historiques.
Ceci est un exemple révélateur de la façon dont les LLM transforment la structure même des données scientifiques. Auparavant, la limite entre « avoir des données » et « ne pas avoir de données » était déterminée par la disponibilité d'équipements de mesure. Désormais, cette limite peut être repoussée en utilisant des modèles de langage qui peuvent extraire des informations quantitatives cachées de textes rédigés sans aucun objectif scientifique.
Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?
AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.