Войти на сайт
МЕЖДУНАРОДНЫЕ ЕЖЕГОДНЫЕ КОНФЕРЕНЦИИ
"СОВРЕМЕННЫЕ ПРОБЛЕМЫ ДИСТАНЦИОННОГО
ЗОНДИРОВАНИЯ ЗЕМЛИ ИЗ КОСМОСА"
(Физические основы, методы и технологии мониторинга окружающей среды, природных и антропогенных объектов)

Двадцать вторая международная конференция "СОВРЕМЕННЫЕ ПРОБЛЕМЫ ДИСТАНЦИОННОГО ЗОНДИРОВАНИЯ ЗЕМЛИ ИЗ КОСМОСА"

XXII.A.546

Сравнение алгоритмов сжатия данных о температуре поверхности Черного моря

Шелопут Т.О. (1), Косолапов И.А. (2,1)
(1) Институт вычислительной математики им. Г.И. Марчука Российской академии наук, Москва, Россия
(2) Московский физико-технический институт (государственный университет), Долгопрудный, Россия
Известно, что из-за необходимости хранения и передачи все большего объема геофизических данных актуальной является проблема разработки эффективных алгоритмов сжатия. В настоящее время существует множество алгоритмов сжатия данных, однако специальных алгоритмов компрессии геофизических данных, учитывающих их структуру и особенности, предложено не так много. Известные алгоритмы сжатия данных без потерь, основанные на кодировании битовых представлений (например, алгоритм Хаффмана), недостаточно эффективны в данной задаче.
В настоящей работе проводится сравнение некоторых подходов к сжатию данных с потерями, не превышающими наперед заданные пороги. Рассматриваются следующие типы данных: двумерные массивы температуры поверхности Черного, Азовского и Мраморного морей, полученные по данным со спутников (Aqua, Terra, SNPP) [1] и данные реанализа за 2019 год, рассчитанные по модели гидротермодинамики Черного и Азовского морей с включением блока вариационной ассимиляции данных [1]. Сравниваются следующие подходы: сжатие матриц данных с помощью вейвлет-преобразования, представление матрицы данных как суммы малоранговой и разреженной (алгоритм восполнения) [2], метод TT-SVD для сжатия многомерного массива данных и нейронные сети (автоэнкодеры). Для сравнения методов использовались следующие параметры: коэффициент сжатия, максимальная абсолютная ошибка и относительная ошибка по норме Фробениуса.
Сравнение методов показало, что сжатие двумерных данных о температуре с помощью вейвлетов наиболее эффективно. Метод восполнения меннее эффективен (при одинаковых потерях коэффициент сжатия примерно в полтора раза меньше). Для всех использованных методов актуальна проблема берегов: способ представления суши в данных существенно влияет на качество сжатия. Для решения проблемы могут быть использованы, например, алгоритмы экстраполяции и жадный алгоритм поиска вложенных массивов, который предложен и описан в работе [3].

Исследование поддержано проектом РНФ №19-71-20035.

Ключевые слова: Сжатие данных, Температура поверхности моря, Вейвлеты, Тензорный поезд, Алгоритм восполнения, Матрицы малого ранга
Литература:
  1. Zakharova N. B. et al. Processing and assimilation of observation data for the hydrodynamics model of the Black Sea and the Sea of Azov //Journal of Physics: Conference Series. – IOP Publishing, 2021. – Т. 2131. – №. 2. – P. 022010.
  2. Petrov S., Zamarashkin N. Matrix completion with sparse measurement errors //Calcolo. 2023. V. 60(1). P. 9.
  3. Оселедец И.В. Вычислительные тензорные методы и их применения // дисс. на соиск. уч. степени д.ф.-м.н. Москва: ИВМ РАН, 2012. 206 с.

Методы и алгоритмы обработки спутниковых данных