Habr AI→ оригинал

Yandex Cloud a montré comment CatBoost repère Heracleum sosnowskyi sur des images satellitaires

Yandex Cloud a expliqué comment elle a construit un système pour détecter Heracleum sosnowskyi sur des images satellitaires avec CatBoost. Le projet a été réali

◐ Слушать статью

Yandex Cloud показала, как автоматизировала поиск борщевика Сосновского на спутниковых снимках с помощью CatBoost. Проект особенно актуален после ужесточения правил: с 1 марта 2026 года владельцы участков обязаны следить за распространением этого растения.

Почему это важно Борщевик давно перестал быть локальной проблемой дачников.

Он быстро захватывает большие территории, вытесняет другие растения и создаёт риски для людей, а потому теперь попал и в поле зрения регуляторов. Когда речь идёт о тысячах гектаров, обходить местность пешком или размечать снимки вручную слишком дорого и медленно. Спутниковые изображения дают масштаб, но без автоматизации они всё равно требуют много ручной работы. Именно на этой точке Yandex Cloud вместе со студентами Школы анализа данных и волонтёрским движением «СтопБорщевик» собрали прикладной ML-кейс. Команда попыталась не просто распознать растение на отдельных кадрах, а построить воспроизводимый технический процесс, который можно перенести на другие задачи дистанционного мониторинга. Такой подход важен для муниципалитетов, экологических инициатив и владельцев земли, которым нужен регулярный контроль, а не разовая проверка.

Как устроен пайплайн В основе решения — классический, но хорошо

собранный пайплайн компьютерного зрения для данных дистанционного зондирования. Сначала снимки в формате GeoTIFF приводят к единому виду, затем из них извлекают признаки, после чего модель учится отделять участки с борщевиком от остального ландшафта. Отдельный акцент сделан на том, что система работает не только с «сырыми» пикселями, но и с признаками, которые помогают лучше уловить характерную структуру растительности.

нормализация и подготовка GeoTIFF-файлов разметка очагов распространения на спутниковых снимках вычисление цветовых и спектральных признаков, включая индекс CIVE обучение модели CatBoost для классификации участков * перенос подхода на поиск других объектов, от вырубок до руин > «Собственный дата-центр не потребуется, это можно сделать в домашних условиях». Для практиков это, пожалуй, самая важная часть истории. Yandex Cloud фактически показывает, что подобные проекты больше не требуют огромной инфраструктуры или дорогой команды из узких специалистов по спутниковым данным.

Если есть доступ к снимкам и достаточно качественная разметка, собрать рабочую модель можно и в относительно компактном окружении. Это снижает порог входа для небольших исследовательских групп, экоактивистов и региональных команд.

Почему выбрали

CatBoost Один из самых интересных выводов материала — не каждая задача на спутниковых снимках автоматически требует нейросети. В кейсе с борщевиком градиентный бустинг на хорошо подготовленных признаках оказался очень конкурентоспособным. Для таких сценариев это логично: данные часто ограничены по объёму, разметка стоит дорого, а объяснимость и скорость экспериментов важны не меньше финального качества.

CatBoost здесь выигрывает за счёт более простого цикла обучения и меньших требований к вычислениям. Важен и более широкий вывод: тот же стек можно применять не только к инвазивным растениям. В статье прямо говорится, что подобная схема подходит для поиска лесных вырубок, разрушенных сооружений и других объектов, которые заметны на аэрофото- или спутниковых снимках.

По сути, речь идёт о шаблоне для прикладного geospatial ML: собрать размеченный датасет, выбрать информативные признаки и обучить модель, которая потом масштабируется на большие территории.

Что это значит

Yandex Cloud показала не просто учебный эксперимент с CatBoost, а довольно практичную модель мониторинга территорий. На фоне новых требований к владельцам участков такие инструменты могут быстро перейти из разряда исследовательских проектов в регулярный рабочий процесс для бизнеса, регионов и экологических служб.

ЖХ
Hamidun News
AI‑новости без шума. Ежедневный редакторский отбор из 400+ источников. Продукт Жемала Хамидуна, Head of AI в Alpina Digital.
Загружаем комментарии…