Новая статья об ограничениях трансформеров в метоокеаническом прогнозировании

Сотрудники лаборатории опубликовали новую статью в Journal of Computational Science о том, когда трансформерные модели хорошо подходят для метоокеанического прогнозирования, а когда более простые сверточные модели остаются лучшим выбором.

Статья “Exploring the limitations of transformer models for metocean forecasting” подготовлена Юлией Борисовой, Михаилом Борисовым, Станиславой Востриковой, Виктором Голиковым, Андреем Кузнецовым, Глебом Соловьевым, Александром А. Степанцом, Михаилом Криницким и Николаем О. Никитиным.

В работе рассмотрены три постановки метоокеанического прогнозирования: долгосрочный прогноз арктического морского льда, коррекция атмосферных смещений и прогноз океанических полей. Авторы сравнивают трансформерные архитектуры со сверточными нейронными сетями и показывают, что ограничения трансформеров зависят от задачи, а не являются универсальными.

Для прогноза арктического морского льда трансформерные модели, включая TimeSformer и SwinLSTM, плохо воспроизводили годовую динамику, в том числе летнее таяние, тогда как легкие CNN-модели показали более высокое качество и улучшили метрики ошибки до 30% относительно существующих state-of-the-art систем. В задаче коррекции атмосферных смещений CNN также оказались сильнее трансформерных альтернатив, снижая ошибки в полях Global Forecast System примерно на 20% относительно трансформеров.

Для океанического прогноза результат оказался другим: трансформеры с контрастивным предобучением показали более высокое качество по всем океаническим переменным, включая снижение ошибки для глубины перемешанного слоя на 40%. Поэтому практический вывод работы таков: для метоокеанического машинного обучения стоит начинать с CNN, если данных мало или важна тонкая пространственная структура, и использовать трансформеры там, где задачу поддерживают представительное обучение и предобучение.

Читать статью

Михаил Криницкий
Михаил Криницкий
Заведующий лабораторией

Current research interests are machine learning and deep learning of various flavours applied in Earth Sciences started with observational applications, now shifted to generic data mining and natural processes modeling. The main applications are in Atmospheric sciences, including remote sensing, and also in Ocean sciences. There are also some applications in geochemistry and paleoreconstruction applications. Lecturing masters courses “Machine learning for Earth Sciences” and “Deep learning for Earth Sciences,” a.k.a. ML4ES and DL4ES (Rus.) in Moscow Institute of Physics and Technology and in Lomonosov Moscow State University.