OlmoEarth v1.1: Allen AI lanzó modelos satelitales 3 veces más baratos
Allen AI lanzó OlmoEarth v1.1 — una nueva familia de modelos para análisis de datos satelitales. El logro principal: los costos computacionales se redujeron 3 v
Procesado por IA desde Hugging Face Blog; editado por Hamidun News
Allen AI presentó OlmoEarth v1.1 — una familia actualizada de modelos de transformador para análisis de imágenes satelitales Sentinel-2. El resultado principal: los costos computacionales cayeron 3 veces, mientras que la calidad del trabajo se mantiene al nivel de la versión anterior.
Cómo cambió la eficiencia
OlmoEarth v1 se lanzó en noviembre de 2025 y atrajo inmediatamente la atención de investigadores y desarrolladores. El modelo funcionaba bien: clasificación precisa de imágenes forestales, determinación confiable de tipos de cultivos, seguimiento de manglares. Pero había un cuello de botella — el costo computacional de la inferencia era una barrera notable para el despliegue en países con presupuestos limitados. OlmoEarth v1.1 está disponible en tres tamaños: Base, Tiny y Nano. Allen AI logró mantener el rendimiento mientras reducía significativamente los costos computacionales. Esto hará que el modelo sea más accesible para empresas y grupos de investigación que desean actualizar frecuentemente los mapas satelitales del planeta.
Solución técnica: rediseño de la tokenización
La clave de la eficiencia es cómo se codifican los datos satelitales en tokens para el transformador. En la OlmoEarth v1 original, cada resolución de satélite (había tres: 10m, 20m y 60m) se codificaba por separado. Los datos de Sentinel-2 tienen tamaño [H, W, T, D=12], donde H y W son las dimensiones espaciales, T es el número de pasos temporales, D es el número de bandas espectrales.
Para cada parche de imagen y cada momento temporal, se obtenían 3 tokens separados. Allen AI rediseñó el enfoque radicalmente: ahora todas las resoluciones se fusionan en un único token por parche por momento temporal. Esto redujo inmediatamente el volumen de tokens 3 veces.
Esto es crítico para los transformadores, porque sus costos computacionales crecen cuadráticamente con la longitud de la secuencia — la mitad de tokens = una cuarta parte de memoria y tiempo.
Pero había un riesgo. Cuando el equipo primero simplemente fusionó los tokens, la calidad cayó en 10 puntos porcentuales en la prueba m-eurosat (reconocimiento de tipos de tierra). La fusión cruda de diferentes bandas espectrales destruía las relaciones relevantes en los datos. Allen AI resolvió el problema rediseñando la metodología de preentrenamiento. El modelo ahora aprende en un único token, pero mantiene la comprensión de las relaciones entre diferentes bandas espectrales a pesar de su fusión.
Lo que funcionó en la práctica
La inferencia en OlmoEarth v1.1 funciona 70% más barato y rápido que en la versión original. Para los desarrolladores esto significa: menos pagos a proveedores en la nube por GPU, actualización más rápida de mapas, experimentos más baratos con nuevos conjuntos de datos. Para los investigadores la nueva versión es valiosa de otra manera. Este es un experimento controlado: solo una cosa cambia — el diseño de tokens, todo lo demás (conjuntos de datos, enfoque de entrenamiento, arquitectura del núcleo) permanece sin cambios. Tales experimentos ayudan a entender qué componentes son realmente críticos:
- Qué aspectos de la arquitectura del transformador afectan el resultado
- Cómo afecta la calidad del conjunto de datos de preentrenamiento
- Qué métodos de preentrenamiento son más efectivos
- Cómo equilibrar entre el tamaño del modelo y la calidad
Qué sigue
Los modelos ya se han implementado en proyectos reales en todo el mundo. Las empresas asociadas utilizan OlmoEarth para rastrear la degradación de bosques en los trópicos, monitorear cambios en los manglares y determinar tipos de cultivos agrícolas. Cada una de estas aplicaciones es crítica para la conservación y la planificación del uso del suelo.
Allen AI ha puesto a disposición pública no solo los modelos, sino también el código para entrenar el modelo. Esto permite a los investigadores reproducir los resultados, entender completamente los detalles de la metodología de preentrenamiento y desarrollar sus propias variantes de arquitectura basadas en el enfoque publicado. Los modelos están disponibles en tres tamaños (Base, Tiny, Nano), lo que permite elegir el equilibrio óptimo entre calidad y velocidad para una tarea específica.
Qué significa esto
La IA satelital está pasando de un área de investigación muy especializada a una herramienta de aplicación masiva. Más barato = más accesible = implementación más rápida. Para las empresas que construyen servicios basados en datos satelitales, esto abre una nueva categoría de precios: millones de imágenes pueden procesarse de manera más económica y los mapas globales pueden actualizarse con mayor frecuencia. Para países con economías en desarrollo, donde el monitoreo ambiental es crítico pero los presupuestos son limitados, esto podría ser un factor decisivo.
¿Quieres dejar de leer sobre IA y empezar a usarla?
AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.