Американские исследователи создали два алгоритма, один из которых обнаруживает массивы солнечных панелей на спутниковых снимках, а второй предсказывает уровень распространения солнечных панелей в районе по его социоэкономическим и экологическим параметрам. Разработчики создали датасет с данными о распространении солнечных панелей на территории США и провели с его помощью анализ влияния различных факторов на распространение этой технологии. Результаты опубликованы в журнале Joule.
В достаточно большом количестве мест солнечные панели могут выступать в качестве экономически выгодного источника электроэнергии в долгосрочной перспективе. Однако цена установки зачастую отталкивает людей от покупки такого оборудования. Некоторые государства стремятся снизить начальную финансовую нагрузку на владельцев домов, предоставляя им субсидии в некоторых регионах. Для разработки подобных программ поддержки специалистам обычно приходится использовать примерные данные, полученные на основе статистики продаж солнечных панелей, расчетов уровня освещенности и других факторов, потому что собрать данные о реальном распространении панелей и их экономической целесообразности достаточно сложно.
Исследователи из Стэнфордского университета под руководством Рэма Раджагопала (Ram Rajagopal) создали алгоритм, способный обнаруживать солнечные панели на спутниковых снимках. За основу они взяли известную сверточную нейросеть Inception-v3, обученную на наборе из 1,28 миллиона фотографий различных объектов. Эту модель они адаптировали для своей задачи, переобучив на своих данных. Для этого исследователи сбросили параметры последнего слоя нейросети и создали специальный датасет.
Часть датасета, используемая для обучения нейросети, состоит из 366467 спутниковых снимков из Google Maps, для каждого из которых есть данные о том, есть ли на нем солнечные панели или нет. Поскольку лишь на 46 тысячах из 366 есть солнечные панели, исследователи применили метод обучения, при котором обучающая среда сильнее «наказывает» алгоритм именно за неправильное распознавание позитивных примеров (снимков, на которых есть солнечные панели). В результате исследователям удалось обучить нейросеть распознавать солнечные панели на снимках с точностью 93,1 процента. К этой нейросети авторы подключили еще одну, которая автоматически выделяет на изображении область, в которой находится солнечная панель или их массив.
После обучения нейросети исследователи использовали ее, чтобы составить базу данных о местоположении солнечных панелей и их размере на всей заселенной территории США. Алгоритм насчитал 1,47 миллиона панелей, что больше, чем данные проекта Open PV, а также проекта Google Sunroof, который не предоставляет данные о размере солнечных панелей. Кроме того, авторы провели анализ полученных данных, сопоставив их с данными другого типа. К примеру, выяснилось, что в солнечных регионах страны доля домов с солнечными панелями растет вместе с доходом, но этот рост прекращается, когда доход владельцев дома превышает 150 тысяч долларов в год, что указывает на другие ограничивающие факторы. Кроме того, распространение солнечных панелей обратно пропрорционально индексу Джини, отражающему расслоение общества по доходу. Также исследователи определили порог внедрения солнечных панелей. Оказалось, что резкий рост распространения начинается с уровня сбора энергии 4,5-5 киловатт-часов на квадратный метр за сутки.
Кроме сбора данных о реальном распространении солнечных панелей, исследователи также создали алгоритм, предсказывающий уровень распространения солнечных панелей для той или иной зоны переписи населения. Эти зоны используются для переписи населения в США, а также для анализа различных социокультурных и других факторов. Алгоритм принимает 94 параметра, такие как уровень инсоляции, тарифы на электроэнергию, уровень дохода жителей и другие, а на выходе выдает прогнозируемое количество солнечных панелей на один дом в зоне.
Ученые находят и другие способы использования спутниковых снимков с помощью нейросетей. Например, недавно другая группа американских исследователей научила нейросеть создавать на основе спутниковых снимков фотографии той же местности, имитирующие съемку с уровня земли.
Григорий Копиев
Она пригодится для прогноза погоды и поиска загрязнений в океане
Инженеры из MIT придумали модель, которая предсказывает океанические течения с помощью машинного обучения. Она хорошо отражает физические свойства течений, поэтому работает точнее других методов. Препринт исследования доступен на arXiv.org. Ученые исследуют течения, чтобы получать информацию о состоянии океана: искать нефтяные и пластиковые загрязнения, отслеживать передвижение рыб и водорослей. Если знать направление течений, можно точнее предсказывать погоду или даже нейтрализовать последствия аварий, таких как пожар на буровой станции Deepwater Horizon в Мексиканском заливе в 2013 году. Данные о направлении течений помогут оценивать масштабы катастроф, чтобы защищать ближайшие воды и побережья. Чтобы изучать течения, в океан запускают буи с GPS. По скорости движения буев определяют скорость и направление океанических течений, а также их закрученность и дивергенцию. Закрученность — это вращательное движение течения вокруг воображаемой оси, похожее на спираль. А дивергенция описывает, как вода опускается или поднимается в процессе движения. Иногда несколько течений объединяются и опускаются ближе ко дну, а иногда — поднимаются к поверхности и растекаются в разные стороны. В 2019 году ученые начали моделировать океанические течения с помощью Гауссовского процесса. Это метод машинного обучения, который основан на вычислении вероятностей. Но первые Гауссовские модели течений оказались неточными с физической точки зрения. Дело в том, что в модель Гауссовского процесса можно добавить информацию о распределении данных. В старую модель добавлялась информация о распределении одной величины — скорости буев. Поскольку величина только одна, закрученность и дивергенция в модели считаются распределенными одинаково и действуют в одном масштабе. Но с физической точки зрения это неверно. В реальности радиусы спиралей, которые образуют закрученные структуры воды, на порядок больше, чем масштабы схождений и расхождений течений при дивергенции. Группа ученых из Массачусетского технологического института (MIT) под руководством Тамары Бродерик (Tamara Broderick) придумала новую модель Гауссовского процесса, которая лучше отражает физические свойства океанических течений. Модель основана на теореме Гельмгольца о разложении векторного поля. Океан здесь выступает в роли векторного поля, каждая точка которого представляет скорость и направление движения воды. По теореме Гельмгольца, одно векторное поле можно представить как сумму двух других векторных полей. В случае с океаном, первое поле определяет закрученность течений, при нулевой дивергенции. А второе — дивергенцию течений, но без закрученности. Это позволило ученым добавить в Гауссовский процесс информацию о том, как распределены данные в каждом поле по отдельности. Такая модель более правильная с точки зрения физики и работает лучше. Качество проверяли на реальных и искусственных данных. Реальные данные получили от более чем 1000 буев в Мексиканском заливе Атлантического океана. Их записывала другая исследовательская группа в течение 2 месяцев в 2016 году, и собрала больше 10 миллионов примеров для обучения. Новую модель сравнили со старым алгоритмом, основанном на Гауссовском процессе без теоремы Гельмгольца. Модели оценивали на трех группах заданий: по предсказанию скорости, закрученности и дивергенции течений. Новая модель Гельмгольца обошла конкурентов в 20 из 24 экспериментов. Средняя ошибка модели Гельмгольца в экспериментах по предсказанию скорости составила 0,42, старой модели — 0,7. Средняя ошибка в предсказании дивергенции оказалась 0,53 для модели Гельмгольца и 0,54 для старой модели. Наконец, средняя ошибка модели Гельмгольца в экспериментах по предсказанию закрученности составила 0,47, а старой модели — 0,77. Ученые утверждают, что новая модель требует ненамного больше вычислительных ресурсов, хотя работает эффективней. Дальше авторы планируют научить ее предсказывать, как океанические течения меняются с течением времени. Другая задача, которую еще предстоит решить — как сделать модель более устойчивой к шуму в обучающих данных. Помимо неустойчивости к шуму, модель страдает от разрозненности данных. Буев, которые собирают данные, ограниченное количество. Все они находятся на разном расстоянии от друг друга, то есть распределены неравномерно. Это ограничивает эффективность модели. Модель научилась предсказывать течения в Атлантическом океане и сможет помочь следить за его загрязнением, но другие океаны тоже страдают от мусора. Недавно команда экологов исследовала загрязнения в Тихом океане и описала целую экосистему, которая образовалась в Большом тихоокеанском мусорном пятне. Там на плавающих кусках мусора активно живут и размножаются разные виды беспозвоночных.