Yandex Cloud showed how CatBoost finds hogweed in satellite images
Yandex Cloud explained how it built a system to detect Sosnowsky's hogweed in satellite images using CatBoost. The project was developed with SHAD students and
Yandex Cloud показала, как автоматизировала поиск борщевика Сосновского на спутниковых снимках с помощью CatBoost. Проект особенно актуален после ужесточения правил: с 1 марта 2026 года владельцы участков обязаны следить за распространением этого растения.
Почему это важно Борщевик давно перестал быть локальной проблемой дачников.
Он быстро захватывает большие территории, вытесняет другие растения и создаёт риски для людей, а потому теперь попал и в поле зрения регуляторов. Когда речь идёт о тысячах гектаров, обходить местность пешком или размечать снимки вручную слишком дорого и медленно. Спутниковые изображения дают масштаб, но без автоматизации они всё равно требуют много ручной работы. Именно на этой точке Yandex Cloud вместе со студентами Школы анализа данных и волонтёрским движением «СтопБорщевик» собрали прикладной ML-кейс. Команда попыталась не просто распознать растение на отдельных кадрах, а построить воспроизводимый технический процесс, который можно перенести на другие задачи дистанционного мониторинга. Такой подход важен для муниципалитетов, экологических инициатив и владельцев земли, которым нужен регулярный контроль, а не разовая проверка.
Как устроен пайплайн В основе решения — классический, но хорошо
собранный пайплайн компьютерного зрения для данных дистанционного зондирования. Сначала снимки в формате GeoTIFF приводят к единому виду, затем из них извлекают признаки, после чего модель учится отделять участки с борщевиком от остального ландшафта. Отдельный акцент сделан на том, что система работает не только с «сырыми» пикселями, но и с признаками, которые помогают лучше уловить характерную структуру растительности.
нормализация и подготовка GeoTIFF-файлов разметка очагов распространения на спутниковых снимках вычисление цветовых и спектральных признаков, включая индекс CIVE обучение модели CatBoost для классификации участков * перенос подхода на поиск других объектов, от вырубок до руин > «Собственный дата-центр не потребуется, это можно сделать в домашних условиях». Для практиков это, пожалуй, самая важная часть истории. Yandex Cloud фактически показывает, что подобные проекты больше не требуют огромной инфраструктуры или дорогой команды из узких специалистов по спутниковым данным.
Если есть доступ к снимкам и достаточно качественная разметка, собрать рабочую модель можно и в относительно компактном окружении. Это снижает порог входа для небольших исследовательских групп, экоактивистов и региональных команд.
Почему выбрали
CatBoost Один из самых интересных выводов материала — не каждая задача на спутниковых снимках автоматически требует нейросети. В кейсе с борщевиком градиентный бустинг на хорошо подготовленных признаках оказался очень конкурентоспособным. Для таких сценариев это логично: данные часто ограничены по объёму, разметка стоит дорого, а объяснимость и скорость экспериментов важны не меньше финального качества.
CatBoost здесь выигрывает за счёт более простого цикла обучения и меньших требований к вычислениям. Важен и более широкий вывод: тот же стек можно применять не только к инвазивным растениям. В статье прямо говорится, что подобная схема подходит для поиска лесных вырубок, разрушенных сооружений и других объектов, которые заметны на аэрофото- или спутниковых снимках.
По сути, речь идёт о шаблоне для прикладного geospatial ML: собрать размеченный датасет, выбрать информативные признаки и обучить модель, которая потом масштабируется на большие территории.
Что это значит
Yandex Cloud показала не просто учебный эксперимент с CatBoost, а довольно практичную модель мониторинга территорий. На фоне новых требований к владельцам участков такие инструменты могут быстро перейти из разряда исследовательских проектов в регулярный рабочий процесс для бизнеса, регионов и экологических служб.