Инженеры сделали физически точную модель океанических течений

Она пригодится для прогноза погоды и поиска загрязнений в океане

Загрузка галереи

Инженеры из MIT придумали модель, которая предсказывает океанические течения с помощью машинного обучения. Она хорошо отражает физические свойства течений, поэтому работает точнее других методов. Препринт исследования доступен на arXiv.org.

Ученые исследуют течения, чтобы получать информацию о состоянии океана: искать нефтяные и пластиковые загрязнения, отслеживать передвижение рыб и водорослей. Если знать направление течений, можно точнее предсказывать погоду или даже нейтрализовать последствия аварий, таких как пожар на буровой станции Deepwater Horizon в Мексиканском заливе в 2013 году. Данные о направлении течений помогут оценивать масштабы катастроф, чтобы защищать ближайшие воды и побережья.

Загрузка галереи

Чтобы изучать течения, в океан запускают буи с GPS. По скорости движения буев определяют скорость и направление океанических течений, а также их закрученность и дивергенцию. Закрученность — это вращательное движение течения вокруг воображаемой оси, похожее на спираль. А дивергенция описывает, как вода опускается или поднимается в процессе движения. Иногда несколько течений объединяются и опускаются ближе ко дну, а иногда — поднимаются к поверхности и растекаются в разные стороны.

В 2019 году ученые начали моделировать океанические течения с помощью Гауссовского процесса. Это метод машинного обучения, который основан на вычислении вероятностей. Но первые Гауссовские модели течений оказались неточными с физической точки зрения. Дело в том, что в модель Гауссовского процесса можно добавить информацию о распределении данных. В старую модель добавлялась информация о распределении одной величины — скорости буев. Поскольку величина только одна, закрученность и дивергенция в модели считаются распределенными одинаково и действуют в одном масштабе. Но с физической точки зрения это неверно. В реальности радиусы спиралей, которые образуют закрученные структуры воды, на порядок больше, чем масштабы схождений и расхождений течений при дивергенции.

Группа ученых из Массачусетского технологического института (MIT) под руководством Тамары Бродерик (Tamara Broderick) придумала новую модель Гауссовского процесса, которая лучше отражает физические свойства океанических течений. Модель основана на теореме Гельмгольца о разложении векторного поля. Океан здесь выступает в роли векторного поля, каждая точка которого представляет скорость и направление движения воды.

По теореме Гельмгольца, одно векторное поле можно представить как сумму двух других векторных полей. В случае с океаном, первое поле определяет закрученность течений, при нулевой дивергенции. А второе — дивергенцию течений, но без закрученности. Это позволило ученым добавить в Гауссовский процесс информацию о том, как распределены данные в каждом поле по отдельности.

Загрузка галереи

Такая модель более правильная с точки зрения физики и работает лучше. Качество проверяли на реальных и искусственных данных. Реальные данные получили от более чем 1000 буев в Мексиканском заливе Атлантического океана. Их записывала другая исследовательская группа в течение 2 месяцев в 2016 году, и собрала больше 10 миллионов примеров для обучения.

Новую модель сравнили со старым алгоритмом, основанном на Гауссовском процессе без теоремы Гельмгольца. Модели оценивали на трех группах заданий: по предсказанию скорости, закрученности и дивергенции течений. Новая модель Гельмгольца обошла конкурентов в 20 из 24 экспериментов. Средняя ошибка модели Гельмгольца в экспериментах по предсказанию скорости составила 0,42, старой модели — 0,7. Средняя ошибка в предсказании дивергенции оказалась 0,53 для модели Гельмгольца и 0,54 для старой модели. Наконец, средняя ошибка модели Гельмгольца в экспериментах по предсказанию закрученности составила 0,47, а старой модели — 0,77.

Ученые утверждают, что новая модель требует ненамного больше вычислительных ресурсов, хотя работает эффективней. Дальше авторы планируют научить ее предсказывать, как океанические течения меняются с течением времени. Другая задача, которую еще предстоит решить — как сделать модель более устойчивой к шуму в обучающих данных.

Помимо неустойчивости к шуму, модель страдает от разрозненности данных. Буев, которые собирают данные, ограниченное количество. Все они находятся на разном расстоянии от друг друга, то есть распределены неравномерно. Это ограничивает эффективность модели.

Модель научилась предсказывать течения в Атлантическом океане и сможет помочь следить за его загрязнением, но другие океаны тоже страдают от мусора. Недавно команда экологов исследовала загрязнения в Тихом океане и описала целую экосистему, которая образовалась в Большом тихоокеанском мусорном пятне. Там на плавающих кусках мусора активно живут и размножаются разные виды беспозвоночных.

Нашли опечатку? Выделите фрагмент и нажмите Ctrl+Enter.

18:4607.04.25 2.4 IT

Microsoft запустила Quake II на нейросетях

Поиграть в него можно прямо в браузере

Андрей Фокин

Microsoft представила генеративную модель WHAMM (World and Human Action MaskGIT Model), предназначенную для создания интерактивных игровых сред в реальном времени. Возможности модели компания продемонстрировала на примере классического шутера Quake II, в который можно сыграть прямо в браузере на странице в Copilot Labs. Архитектура модели WHAMM включает два этапа. Основной трансформер (500 миллион параметров) получает 9 предыдущих пар кадр-действие и формирует грубый набросок нового кадра размером 640 × 360 пикселей. Затем другой трансформер (250 миллионов параметров) итеративно улучшает это изображение. В результате удается генерировать интерактивный видеоряд со скоростью свыше 10 кадров в секунду. Модель обучена на данных одной недели геймплея Quake II, собранных на одном уровне. Пользователи могут перемещаться по имитируемому моделью уровню, стрелять и взаимодействовать с объектами (например, взрывать бочки). Но есть и неточности: например, модель ошибается в счетчиках патронов и здоровья, враги выглядят размыто и бой с ними не всегда корректен, а из-за короткого контекста всего 0,9 секунды модель быстро забывает об объектах вне поля зрения.