OlmoEarth v1.1: Allen AI выпустила спутниковые модели на 3 раза дешевле
Allen AI выпустила OlmoEarth v1.1 — новое семейство моделей для анализа спутниковых данных. Главное достижение: вычислительные затраты сократились в 3 раза при

Allen AI представила OlmoEarth v1.1 — обновленное семейство трансформер-моделей для анализа спутниковых снимков Sentinel-2. Главный результат: вычислительные затраты упали в 3 раза, а качество работы остаётся на уровне предыдущей версии.
Как менялась эффективность
OlmoEarth v1 вышла в ноябре 2025 и сразу привлекла внимание исследователей и разработчиков. Модель работала хорошо: точная классификация лесных снимков, надёжное определение типов культур, отслеживание мангровых лесов. Но было узкое место — вычислительная стоимость инференса была заметным барьером для развёртывания в странах с ограниченным бюджетом. OlmoEarth v1.1 доступна в трёх размерах: Base, Tiny и Nano. Allen AI удалось сохранить производительность при значительном снижении затрат на вычисления. Это сделает модель более доступной для компаний и исследовательских групп, которые хотят часто обновлять спутниковые карты планеты.
Техническое решение: переработка токенизации
Ключ к эффективности — как спутниковые данные кодируются в токены для трансформера. В оригинальной OlmoEarth v1 каждое разрешение спутника (их было три: 10м, 20м и 60м) кодировалось отдельно. Данные Sentinel-2 имеют размер [H, W, T, D=12], где H и W — пространственные размеры, T — число временных шагов, D — число спектральных диапазонов.
Для каждого патча изображения и каждого момента времени получалось 3 отдельных токена. Allen AI переработала подход радикально: все разрешения теперь сливаются в один токен на патч на момент времени. Это сразу сократило объём токенов в 3 раза.
Это критично для трансформеров, потому что их вычислительные затраты растут квадратично от длины последовательности — вдвое меньше токенов = вчетверо меньше памяти и времени. Но был риск. Когда команда впервые просто объединила токены, качество упало на 10 процентных пунктов на тесте m-eurosat (распознавание типов земель).
Сырое слияние разных спектральных диапазонов разрушало релевантные связи в данных. Allen AI решила проблему, переработав методику предварительного обучения. Модель теперь учится на едином токене, но сохраняет понимание связей между разными спектральными диапазонами несмотря на их объединение.
Что получилось на практике
Инференс на OlmoEarth v1.1 работает на 70% дешевле и быстрее, чем на оригинальной версии. Для разработчиков это значит: меньше платить облачным провайдерам за GPU, быстрее обновлять карты, дешевле экспериментировать с новыми датасетами.
Для исследователей новая версия ценна другим. Это контролируемый эксперимент: меняется только одно — дизайн токенов, всё остальное (датасеты, подход обучения, архитектура ядра) неизменно. Такие эксперименты помогают понять, какие компоненты действительно критичны: Какие аспекты архитектуры трансформера влияют на результат Как влияет качество датасета предварительного обучения Какие методы предварительного обучения наиболее эффективны Как балансировать между размером модели и качеством ## Что дальше Модели уже развёрнуты в реальных проектах по всему миру.
Partner-компании используют OlmoEarth для отслеживания деградации лесов в тропиках, мониторинга изменений мангровых лесов и определения типов сельскохозяйственных культур. Каждое из этих приложений критично для консервации и планирования использования земли. Allen AI выложила в открытый доступ не только модели, но и код для обучения модели.
Это позволяет исследователям повторить результаты, полностью понять детали методики предварительного обучения и развивать собственные варианты архитектуры на основе опубликованного подхода. Доступны модели в трёх размерах (Base, Tiny, Nano), что позволяет выбрать оптимальный компромисс между качеством и скоростью для конкретной задачи.
Что это значит
Спутниковый AI переходит из узкоспециальной области исследований в инструмент массового применения. Дешевле = доступнее = быстрее развёртывание. Для компаний, которые строят сервисы на основе спутниковых данных, это открывает новую ценовую категорию: миллионы снимков можно обрабатывать экономнее и чаще обновлять глобальные карты. Для стран с развивающимися экономиками, где экомониторинг критичен но бюджеты ограничены, это может быть решающим фактором.