OlmoEarth v1.1: Allen AI lançou modelos de satélite 3 vezes mais baratos
Allen AI lançou OlmoEarth v1.1 — uma nova família de modelos para análise de dados de satélite. A principal conquista: custos computacionais foram reduzidos em
Processado por IA de Hugging Face Blog; editado por Hamidun News
Allen AI apresentou OlmoEarth v1.1 — uma família atualizada de modelos transformadores para análise de imagens de satélite Sentinel-2. O principal resultado: custos computacionais caíram em 3 vezes, e a qualidade do trabalho permanece no nível da versão anterior.
Como evoluiu a eficiência
v1 foi lançada em novembro de 2025 e imediatamente chamou atenção de pesquisadores e desenvolvedores. O modelo funcionava bem: classificação precisa de imagens florestais, determinação confiável de tipos de culturas, rastreamento de manguezais. Mas havia um gargalo — o custo computacional da inferência era uma barreira notável para implantação em países com orçamento limitado.
OlmoEarth v1.1 está disponível em três tamanhos: Base, Tiny e Nano. Allen AI conseguiu manter o desempenho reduzindo significativamente os custos computacionais. Isso tornará o modelo mais acessível para empresas e grupos de pesquisa que desejam atualizar frequentemente mapas de satélite do planeta.
Solução técnica: reelaboração da tokenização
A chave para a eficiência está em como os dados de satélite são codificados em tokens para o transformador. No OlmoEarth v1 original, cada resolução de satélite (eram três: 10m, 20m e 60m) era codificada separadamente. Os dados do Sentinel-2 têm tamanho [H, W, T, D=12], onde H e W são dimensões espaciais, T é o número de passos temporais, D é o número de faixas espectrais. Para cada patch de imagem e cada momento temporal, resultavam em 3 tokens separados.
Allen AI reelaborou a abordagem radicalmente: todas as resoluções agora são mescladas em um único token por patch por momento temporal. Isso imediatamente reduziu o volume de tokens em 3 vezes. Isso é crítico para transformadores, porque seus custos computacionais crescem quadraticamente com o comprimento da sequência — metade dos tokens = um quarto da memória e do tempo.
Mas havia um risco. Quando a equipe simplesmente mesclou os tokens pela primeira vez, a qualidade caiu em 10 pontos percentuais no teste m-eurosat (reconhecimento de tipos de terreno). A simples fusão de diferentes faixas espectrais destruía as relações relevantes nos dados. Allen AI resolveu o problema reelaborando a metodologia de pré-treinamento. O modelo agora aprende com um único token, mas mantém a compreensão das relações entre diferentes faixas espectrais apesar de sua mesclagem.
O que resultou na prática
A inferência no OlmoEarth v1.1 funciona 70% mais barato e rápido do que na versão original. Para desenvolvedores isso significa: pagar menos aos provedores de nuvem por GPU, atualizar mapas mais rápido, experimentar novos conjuntos de dados mais barato. Para pesquisadores a nova versão é valiosa de outra forma. Este é um experimento controlado: apenas um aspecto muda — o design de tokens, todo o resto (conjuntos de dados, abordagem de treinamento, arquitetura do núcleo) permanece inalterado. Tais experimentos ajudam a entender quais componentes são realmente críticos:
- Quais aspectos da arquitetura do transformador afetam o resultado
- Como a qualidade do conjunto de dados de pré-treinamento afeta
- Quais métodos de pré-treinamento são mais eficazes
- Como equilibrar entre tamanho do modelo e qualidade
O que vem a seguir
Os modelos já foram implantados em projetos reais em todo o mundo. Empresas parceiras usam OlmoEarth para rastrear degradação de florestas nos trópicos, monitorar mudanças em manguezais e determinar tipos de culturas agrícolas. Cada uma dessas aplicações é crítica para conservação e planejamento do uso da terra. Allen AI colocou em acesso aberto não apenas os modelos, mas também o código para treinar o modelo. Isso permite que pesquisadores repliquem os resultados, entendam completamente os detalhes da metodologia de pré-treinamento e desenvolvam suas próprias variações de arquitetura com base na abordagem publicada. Os modelos estão disponíveis em três tamanhos (Base, Tiny, Nano), o que permite escolher o compromisso ideal entre qualidade e velocidade para uma tarefa específica.
O que isso significa
A IA de satélite está passando de uma área de pesquisa altamente especializada para uma ferramenta de uso em massa. Mais barato = mais acessível = implantação mais rápida. Para empresas que constroem serviços baseados em dados de satélite, isso abre uma nova categoria de preço: milhões de imagens podem ser processadas mais economicamente e mapas globais podem ser atualizados com mais frequência. Para países com economias em desenvolvimento, onde o monitoramento ambiental é crítico, mas os orçamentos são limitados, isso pode ser um fator decisivo.
Quer parar de ler sobre IA e começar a usar?
AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.