Американские ученые предложили использовать нейросеть для определения уровня бедности в развивающихся странах Африки. Метод заключается в том, что искусственный интеллект анализирует спутниковые фотографии определенной местности, после чего на основе ее особенностей дает оценку благосостояния жителей всего региона. По словам исследователей, такой подход не требует больших денежных затрат и может восполнить пробелы в необходимых данных. Об этом рассказывает статья, опубликованная в журнале Science.
Как правило, для определения достатка регионов используются различные методы. В число популярных входят опросы, которые помогают оценить величину расходов человека на удовлетворение минимальных потребностей и стоимость имущества одного домохозяйства — группы людей, проживающих вместе. Однако крупномасштабные исследования обычно требуют больших затрат со стороны правительств, поэтому в экономически слабо развитых странах они проводятся не часто и не повсеместно. Это создает дефицит информации, который, в свою очередь, мешает не только определить области страны, наиболее нуждающиеся в помощи, но и оценить ситуацию в мире — например то, как выполняются цели по развитию, поставленные ООН к 2030 году.
Сейчас исследователи пытаются придумать альтернативные способы восполнения пробелов в традиционных методах. Например, в прошлом году ученые предложили использовать данные мобильных операторов об истории звонков и смс пользователей, чтобы определить уровень богатства в разных районах страны. Другим относительно новым и удобным методом стала оценка благосостояния районов по интенсивности ночного освещения (чем оно ярче, тем состоятельнее там население). Однако такой подход хуже работает на местности, где люди живут за международной чертой бедности (1,9 доллара на душу населения), — там освещение слабое в принципе.
В новой работе ученые предложили использовать сверточную нейросеть, обучив ее обрабатывать спутниковые снимки местности. Многослойная архитектура такого типа сетей позволяет анализировать изображения высокого уровня абстракции. В данном случае на вход нейрона подается не вся картинка, а небольшая ее часть, которая обрабатывается программой. После этого получается карта признаков, которая тоже несколько раз «пропускается» через нейросеть, и в конечном итоге искусственный интеллект определяет, что изображено на снимке. Более подробно о том, как нейросети работают с изображениями, рассказано в нашем прошлом материале.
Авторы работы разбили процесс обучения нейросети на несколько этапов. Сначала они с помощью крупной базы изображений подготовили систему: научили ее определять, что изображено на снимке, и находить мелкие детали, вроде крыш домов. Затем исследователи взяли ночные и дневные спутниковые фотографии местности и научили программу сопоставлять эти снимки, чтобы находить на них по уровню освещенности экономически богатые районы. Сочетание этих двух этапов обучения позволило нейросети самостоятельно определить, какие еще особенности отличают благополучные области на карте — например, наличие дорог или воды.
После этого программисты использовали результаты двух опросов, проведенных Всемирным Банком и проектом Demographic and Health Surveys. Из первого были взяты данные о средних потребительских расходах домохозяйств, которые были объединены на карте в отдельные кластеры (фактически, отдельный кластер был эквивалентен деревне или городскому району). Из второго опроса ученые использовали данные об «индексе богатства», рассчитанного на основе владения имуществом домохозяйствами, также поделенными на группы. Результаты опросов, привязанные к картам местности, нейросеть сопоставляла со спутниковыми снимками той же местности и теми ее особенностями, которые указывают на экономическую активность населения.
В итоге программа научилась самостоятельно восполнять пробелы в данных, основываясь на деталях каждой конкретной местности. Ее работу ученые проверили на примере пяти африканских стран, по которым были доступны результаты опросов, — Нигерии, Танзании, Уганды, Малави и Руанды. В результате предсказания искусственного интеллекта в 75 процентах случаев совпадали с реальными данными о среднем достатке домохозяйств (если говорить точнее, то проценты — это на самом деле коэффициент детерминации, который показывает, насколько условная дисперсия модели отличается от дисперсии реальных значений). В случае с предсказанием на основе потребительских расходов программа показала меньший результат — 55 процентов.
Точность оценки новой программы превзошла предыдущие методы. Кроме того, так как искусственный интеллект работает исключительно с открытыми и легко доступными данными (в отличие, например, от логов мобильных операторов, которые надо запрашивать у каждого оператора в отдельности), этот подход оказывается более простым и дешевым. То, что карты обновляются относительно часто — приблизительно раз в год, позволяет отслеживать динамику изменений.
Наиболее явным практическим результатом применения метода оценки благосостояния жителей беднейших стран с помощью спутниковых снимков и обученной нейросети может стать более точное распределение помощи со стороны как правительств этих стран, так и международных организаций. Так, только в рамках Программы развития ООН в 2012 году странам Африки была выделена помощь в размере 1,08 миллиарда долларов. В августе этого года Центральный фонд реагирования ООН выделил 50 миллионов долларов на оказание чрезвычайной помощи жителям шести стран Африки: Центральноафриканской Республики, Чада, Демократической Республики Конго, Руанды, Йемена и Эритреи.
Кристина Уласович