Exploring the limitations of transformer models for metocean forecasting

Аннотация

Трансформерные модели широко применяются в разных областях и часто рассматривают пространственно-временные данные как видеоподобные последовательности благодаря успехам генеративного предсказания видео. Однако эта статья показывает, что трансформеры не всегда оптимальны для пространственно-временных данных с длинными горизонтами прогноза и выраженной периодичностью. На примере метоокеанического прогнозирования, включая морской лед, океанические и атмосферные данные, авторы сравнивают трансформерные модели со сверточными нейронными сетями. В задаче долгосрочного прогноза арктического морского льда TimeSformer и SwinLSTM не смогли воспроизвести годовую динамику, включая летнее таяние. При этом легкая CNN-модель превзошла современные численные и data-driven прогнозы, улучшив метрики ошибки до 30%. В задаче коррекции атмосферных смещений CNN также оказались сильнее, снижая ошибки в полях Global Forecast System на 20% относительно трансформеров. Ситуация меняется для океанического прогноза: трансформерные модели с контрастивным предобучением показали преимущество по всем океаническим переменным, включая снижение ошибки для глубины перемешанного слоя на 40%. Три рассмотренных случая показывают, что ограничения трансформеров существуют, но зависят от постановки задачи, тогда как CNN остаются подходящим выбором при ограниченных данных или необходимости сохранять тонкую пространственную структуру.

Тип публикации
Публикация
Journal of Computational Science, 99:102917
Михаил Борисов
Михаил Борисов
Исследователь, аспирант МФТИ

TBA

Станислава Вострикова
Станислава Вострикова
Исследователь, студент магистратуры МФТИ

TBA

Виктор Голиков
Виктор Голиков
Исследователь, аспирант ИО РАН

TBA

Михаил Криницкий
Михаил Криницкий
Заведующий лабораторией

Current research interests are machine learning and deep learning of various flavours applied in Earth Sciences started with observational applications, now shifted to generic data mining and natural processes modeling. The main applications are in Atmospheric sciences, including remote sensing, and also in Ocean sciences. There are also some applications in geochemistry and paleoreconstruction applications. Lecturing masters courses “Machine learning for Earth Sciences” and “Deep learning for Earth Sciences,” a.k.a. ML4ES and DL4ES (Rus.) in Moscow Institute of Physics and Technology and in Lomonosov Moscow State University.