Exploring the limitations of transformer models for metocean forecasting

Юлия Борисова, Михаил Борисов, Станислава Вострикова, Виктор Голиков, Андрей Кузнецов, Глеб Соловьев, Александр А. Степанец, Михаил Криницкий, Николай О. Никитин

июня 2026

Аннотация

Трансформерные модели широко применяются в разных областях и часто рассматривают пространственно-временные данные как видеоподобные последовательности благодаря успехам генеративного предсказания видео. Однако эта статья показывает, что трансформеры не всегда оптимальны для пространственно-временных данных с длинными горизонтами прогноза и выраженной периодичностью. На примере метоокеанического прогнозирования, включая морской лед, океанические и атмосферные данные, авторы сравнивают трансформерные модели со сверточными нейронными сетями. В задаче долгосрочного прогноза арктического морского льда TimeSformer и SwinLSTM не смогли воспроизвести годовую динамику, включая летнее таяние. При этом легкая CNN-модель превзошла современные численные и data-driven прогнозы, улучшив метрики ошибки до 30%. В задаче коррекции атмосферных смещений CNN также оказались сильнее, снижая ошибки в полях Global Forecast System на 20% относительно трансформеров. Ситуация меняется для океанического прогноза: трансформерные модели с контрастивным предобучением показали преимущество по всем океаническим переменным, включая снижение ошибки для глубины перемешанного слоя на 40%. Три рассмотренных случая показывают, что ограничения трансформеров существуют, но зависят от постановки задачи, тогда как CNN остаются подходящим выбором при ограниченных данных или необходимости сохранять тонкую пространственную структуру.

Тип публикации

Статья для журнала

Публикация

Journal of Computational Science, 99:102917

Михаил Криницкий

Заведующий лабораторией

Current research interests are machine learning and deep learning of various flavours applied in Earth Sciences started with observational applications, now shifted to generic data mining and natural processes modeling. The main applications are in Atmospheric sciences, including remote sensing, and also in Ocean sciences. There are also some applications in geochemistry and paleoreconstruction applications. Lecturing masters courses “Machine learning for Earth Sciences” and “Deep learning for Earth Sciences,” a.k.a. ML4ES and DL4ES (Rus.) in Moscow Institute of Physics and Technology and in Lomonosov Moscow State University.

Exploring the limitations of transformer models for metocean forecasting

Аннотация

Михаил Борисов

Исследователь, аспирант МФТИ

Станислава Вострикова

Исследователь, студент магистратуры МФТИ

Виктор Голиков

Исследователь, аспирант ИО РАН

Михаил Криницкий

Заведующий лабораторией