Войти на сайт
МЕЖДУНАРОДНЫЕ ЕЖЕГОДНЫЕ КОНФЕРЕНЦИИ
"СОВРЕМЕННЫЕ ПРОБЛЕМЫ ДИСТАНЦИОННОГО
ЗОНДИРОВАНИЯ ЗЕМЛИ ИЗ КОСМОСА"
(Физические основы, методы и технологии мониторинга окружающей среды, природных и антропогенных объектов)

Двадцать вторая международная конференция "СОВРЕМЕННЫЕ ПРОБЛЕМЫ ДИСТАНЦИОННОГО ЗОНДИРОВАНИЯ ЗЕМЛИ ИЗ КОСМОСА"

Участие в Школе молодых 

XXII.F.504

Сравнительный анализ методов машинного обучения при картографировании массивов открытых песков по спутниковым данным

Полтарин В.С. (1), Шинкаренко С.С. (1)
(1) Институт космических исследований РАН, Москва, Россия
В докладе рассматривается сравнительная характеристика ансамблевых методов машинного обучения для задач бинарной классификации открытых песков и дефлированных территорий в аридных пастбищных ландшафтах на основе обучающей выборки, полученной с помощью масок максимальных и минимальных значений площади открытых песков за весь рассматриваемый год по данным Sentinel-2. Приведены основные шаги для получения качественной классификации с помощью библиотеки scikit-learn для python, различные метрики точности, а также временные затраты на обучение ансамблевых моделей. Выявлено, что при сопоставимом уровне точности при использовании различных методов, основными критериями для выбора модели является минимальное число необходимых гиперпараметров, а также время, затраченное на обучение.
Автоматизированное дешифрирование для задач обнаружения открытых песков и дефлированных территорий по спутниковым данным ансамблевыми методами машинного обучения имеет высокую точность, автономность выполнения, а также универсальность в использовании модели на протяжении года даже с учетом фенологических изменений. Границы полигонов, полученные в результате расчета моделей, хорошо согласуются с уже имеющимися данными, однако по подсчетам площадей было выявлено, что модели машинного обучения способны идентифицировать те пиксели, которые классические методы были не способны найти. Выявлено, что при корректном подборе гиперпараметров, точность итоговой модели составляет около 99%, а время, затраченное на работу, различается весьма заметно. Таким образом, наиболее быстрые результаты дали модели HistogramGradientBoosting и XGBoost, но при сравнении этих моделей в контексте точности, метод HistogramGradientBoosting проигрывает.

Работа выполнена в рамках темы ИКИ РАН «Мониторинг» (госрегистрация № 122042500031-8) с использованием сервиса «Вега-Science» (Loupian et al., 2022) и инфраструктуры Центра коллективного пользования «ИКИ-Мониторинг» (Лупян и др., 2015).

Ключевые слова: Машинное обучение, деградация, аридные ландшафты, опустынивание, дистанционное зондирование

Дистанционное зондирование растительных и почвенных покровов