Hugging Face Blog→ original

OlmoEarth v1.1 : Allen AI lance des modèles satellites 3 fois moins chers

Allen AI a lancé OlmoEarth v1.1 — une nouvelle famille de modèles pour l'analyse de données satellites. La principale réussite : les coûts de calcul ont été réd

Traité par IA depuis Hugging Face Blog ; édité par Hamidun News
OlmoEarth v1.1 : Allen AI lance des modèles satellites 3 fois moins chers
Source : Hugging Face Blog. Collage: Hamidun News.
◐ Écouter l'article

Allen AI a présenté OlmoEarth v1.1 — une famille mise à jour de modèles transformateurs pour l'analyse d'images satellites Sentinel-2. Le résultat principal : les coûts de calcul ont baissé de 3 fois, tandis que la qualité reste au niveau de la version précédente.

Comment l'efficacité a changé

OlmoEarth v1 a été lancée en novembre 2025 et a immédiatement attiré l'attention des chercheurs et des développeurs. Le modèle fonctionnait bien : classification précise des images forestières, identification fiable des types de cultures, surveillance des forêts de mangroves. Mais il y avait un goulot d'étranglement — le coût de calcul de l'inférence était une barrière notable pour le déploiement dans les pays ayant des budgets limités.

OlmoEarth v1.1 est disponible en trois tailles : Base, Tiny et Nano. Allen AI a réussi à maintenir les performances tout en réduisant significativement les coûts de calcul. Cela rendra le modèle plus accessible aux entreprises et aux groupes de recherche qui souhaitent mettre à jour fréquemment les cartes satellites de la planète.

Solution technique : refonte de la tokenisation

La clé de l'efficacité réside dans la façon dont les données satellites sont codées en jetons pour le transformateur. Dans l'OlmoEarth v1 d'origine, chaque résolution satellite (il y en avait trois : 10m, 20m et 60m) était codée séparément. Les données Sentinel-2 ont la taille [H, W, T, D=12], où H et W sont les dimensions spatiales, T est le nombre d'étapes temporelles, D est le nombre de bandes spectrales. Pour chaque patch d'image et à chaque moment donné, cela produisait 3 jetons distincts.

Allen AI a refondu l'approche radicalement : toutes les résolutions sont maintenant fusionnées en un seul jeton par patch à chaque moment donné. Cela a immédiatement réduit le volume de jetons de 3 fois. C'est critique pour les transformateurs, car leurs coûts de calcul augmentent de façon quadratique en fonction de la longueur de la séquence — deux fois moins de jetons = quatre fois moins de mémoire et de temps.

Mais il y avait un risque. Lorsque l'équipe a d'abord simplement fusionné les jetons, la qualité a baissé de 10 points de pourcentage sur le test m-eurosat (reconnaissance des types de terres). La fusion brute de différentes bandes spectrales détruisait les liens pertinents dans les données. Allen AI a résolu le problème en refonçant la méthodologie de préentraînement. Le modèle apprend maintenant sur un jeton unique, mais conserve la compréhension des relations entre les différentes bandes spectrales malgré leur fusion.

Ce qui s'est passé en pratique

L'inférence sur OlmoEarth v1.1 fonctionne 70% moins cher et plus vite que sur la version d'origine. Pour les développeurs, cela signifie : payer moins aux fournisseurs cloud pour les GPU, mettre à jour les cartes plus rapidement, expérimenter avec les nouveaux ensembles de données moins cher.

Pour les chercheurs, la nouvelle version est précieuse pour d'autres raisons. C'est une expérience contrôlée : une seule chose change — la conception des jetons, tout le reste (ensembles de données, approche d'entraînement, architecture du noyau) reste inchangé. Ces expériences aident à comprendre quels composants sont vraiment critiques :

  • Quels aspects de l'architecture du transformateur affectent le résultat
  • Comment la qualité de l'ensemble de données de préentraînement affecte
  • Quelles méthodes de préentraînement sont les plus efficaces
  • Comment équilibrer entre la taille du modèle et la qualité

Qu'est-ce qui vient ensuite

Les modèles sont déjà déployés dans des projets réels partout dans le monde. Les sociétés partenaires utilisent OlmoEarth pour suivre la dégradation des forêts tropicales, surveiller les changements des forêts de mangroves et déterminer les types de cultures agricoles. Chacune de ces applications est critique pour la conservation et la planification de l'utilisation des terres.

Allen AI a mis à la disposition du public non seulement les modèles, mais aussi le code pour entraîner le modèle. Cela permet aux chercheurs de reproduire les résultats, de comprendre pleinement les détails de la méthodologie de préentraînement et de développer leurs propres variantes d'architecture basées sur l'approche publiée. Les modèles sont disponibles en trois tailles (Base, Tiny, Nano), ce qui permet de choisir le compromis optimal entre la qualité et la vitesse pour une tâche donnée.

Ce que cela signifie

L'IA satellite passe d'un domaine de recherche hautement spécialisé à un outil d'application massive. Moins cher = plus accessible = déploiement plus rapide. Pour les entreprises qui créent des services basés sur des données satellites, cela ouvre une nouvelle catégorie de prix : des millions d'images peuvent être traitées de manière plus économique et les cartes mondiales peuvent être mises à jour plus souvent. Pour les pays aux économies en développement, où la surveillance environnementale est critique mais les budgets limités, cela pourrait être un facteur décisif.

ZK
Hamidun News
Actualités IA sans bruit. Sélection éditoriale quotidienne de plus de 400 sources. Produit de Zhemal Khamidun, Head of AI chez Alpina Digital.

Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?

AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.

Qu'en pensez-vous ?
Chargement des commentaires…