Hugging Face Blog→ original

OlmoEarth v1.1: Allen AI lançou modelos de satélite 3 vezes mais baratos

Allen AI lançou OlmoEarth v1.1 — uma nova família de modelos para análise de dados de satélite. A principal conquista: custos computacionais foram reduzidos em

Processado por IA de Hugging Face Blog; editado por Hamidun News
OlmoEarth v1.1: Allen AI lançou modelos de satélite 3 vezes mais baratos
Fonte: Hugging Face Blog. Colagem: Hamidun News.
◐ Ouvir artigo

Allen AI apresentou OlmoEarth v1.1 — uma família atualizada de modelos transformadores para análise de imagens de satélite Sentinel-2. O principal resultado: custos computacionais caíram em 3 vezes, e a qualidade do trabalho permanece no nível da versão anterior.

Como evoluiu a eficiência

v1 foi lançada em novembro de 2025 e imediatamente chamou atenção de pesquisadores e desenvolvedores. O modelo funcionava bem: classificação precisa de imagens florestais, determinação confiável de tipos de culturas, rastreamento de manguezais. Mas havia um gargalo — o custo computacional da inferência era uma barreira notável para implantação em países com orçamento limitado.

OlmoEarth v1.1 está disponível em três tamanhos: Base, Tiny e Nano. Allen AI conseguiu manter o desempenho reduzindo significativamente os custos computacionais. Isso tornará o modelo mais acessível para empresas e grupos de pesquisa que desejam atualizar frequentemente mapas de satélite do planeta.

Solução técnica: reelaboração da tokenização

A chave para a eficiência está em como os dados de satélite são codificados em tokens para o transformador. No OlmoEarth v1 original, cada resolução de satélite (eram três: 10m, 20m e 60m) era codificada separadamente. Os dados do Sentinel-2 têm tamanho [H, W, T, D=12], onde H e W são dimensões espaciais, T é o número de passos temporais, D é o número de faixas espectrais. Para cada patch de imagem e cada momento temporal, resultavam em 3 tokens separados.

Allen AI reelaborou a abordagem radicalmente: todas as resoluções agora são mescladas em um único token por patch por momento temporal. Isso imediatamente reduziu o volume de tokens em 3 vezes. Isso é crítico para transformadores, porque seus custos computacionais crescem quadraticamente com o comprimento da sequência — metade dos tokens = um quarto da memória e do tempo.

Mas havia um risco. Quando a equipe simplesmente mesclou os tokens pela primeira vez, a qualidade caiu em 10 pontos percentuais no teste m-eurosat (reconhecimento de tipos de terreno). A simples fusão de diferentes faixas espectrais destruía as relações relevantes nos dados. Allen AI resolveu o problema reelaborando a metodologia de pré-treinamento. O modelo agora aprende com um único token, mas mantém a compreensão das relações entre diferentes faixas espectrais apesar de sua mesclagem.

O que resultou na prática

A inferência no OlmoEarth v1.1 funciona 70% mais barato e rápido do que na versão original. Para desenvolvedores isso significa: pagar menos aos provedores de nuvem por GPU, atualizar mapas mais rápido, experimentar novos conjuntos de dados mais barato. Para pesquisadores a nova versão é valiosa de outra forma. Este é um experimento controlado: apenas um aspecto muda — o design de tokens, todo o resto (conjuntos de dados, abordagem de treinamento, arquitetura do núcleo) permanece inalterado. Tais experimentos ajudam a entender quais componentes são realmente críticos:

  • Quais aspectos da arquitetura do transformador afetam o resultado
  • Como a qualidade do conjunto de dados de pré-treinamento afeta
  • Quais métodos de pré-treinamento são mais eficazes
  • Como equilibrar entre tamanho do modelo e qualidade

O que vem a seguir

Os modelos já foram implantados em projetos reais em todo o mundo. Empresas parceiras usam OlmoEarth para rastrear degradação de florestas nos trópicos, monitorar mudanças em manguezais e determinar tipos de culturas agrícolas. Cada uma dessas aplicações é crítica para conservação e planejamento do uso da terra. Allen AI colocou em acesso aberto não apenas os modelos, mas também o código para treinar o modelo. Isso permite que pesquisadores repliquem os resultados, entendam completamente os detalhes da metodologia de pré-treinamento e desenvolvam suas próprias variações de arquitetura com base na abordagem publicada. Os modelos estão disponíveis em três tamanhos (Base, Tiny, Nano), o que permite escolher o compromisso ideal entre qualidade e velocidade para uma tarefa específica.

O que isso significa

A IA de satélite está passando de uma área de pesquisa altamente especializada para uma ferramenta de uso em massa. Mais barato = mais acessível = implantação mais rápida. Para empresas que constroem serviços baseados em dados de satélite, isso abre uma nova categoria de preço: milhões de imagens podem ser processadas mais economicamente e mapas globais podem ser atualizados com mais frequência. Para países com economias em desenvolvimento, onde o monitoramento ambiental é crítico, mas os orçamentos são limitados, isso pode ser um fator decisivo.

ZK
Hamidun News
Notícias de AI sem ruído. Seleção editorial diária de mais de 400 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.

Quer parar de ler sobre IA e começar a usar?

AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.

O que você acha?
Carregando comentários…