Нейросеть предсказала ожирение жителей по спутниковым снимкам городов

Maharana & Nsoesie / Health Information, 2018

Американские исследователи обучили сверточную нейросеть классифицировать спутниковые снимки местности по наличию на них зданий, дорог, растительности и водоемов, и предсказывать на основе этих данных уровень ожирения жителей. Метод показал свою эффективность: характеристики антропогенной среды могут предсказывать до 64,8 процента различий в количестве людей с избыточным весом. Исследование опубликовано в журнале Health Informatics.

Ожирение провоцирует множество заболеваний. К примеру, избыточный вес может повысить шансы развития рака толстой кишки, ожирение в младенчестве ухудшает когнитивные способности в детстве, а также снижает эффективность прививки от гриппа во взрослом возрасте. Число людей с высоким риском развития ожирения растет с каждым годом: за последние сорок лет число детей с лишним весом выросло в десять раз.

Увеличивают риск развития ожирения, в основном, два фактора: неправильное питание и недостаточная физическая активность. На них, в свою очередь, влияет антропогенная среда — доступность определенных благ цивилизации: парков и аллей для прогулок, ресторанов быстрого питания, а также общественного транспорта. Тем не менее, исследования, сосредоточенные на связи окружения и ожирения обычно неполны из-за недостатка необходимых данных или способов анализа.

Изучить эту взаимосвязь решили Адяша Махарана (Adyasha Maharana) и Элейн Оканьене Нзоези (Elaine Okanyene Nsoesie) из Вашингтонского университета. Для этого они взяли примерно 150 тысяч изображений местности Google Static Maps API — сервиса, который предоставляет фотографии со спутника в высоком разрешении. Сосредоточиться ученые решили на четырех городах США: Лос-Анджелесе (Калифорния), Мемфисе (Теннесси), Сан-Антонио (Техас) и Сиэтле (Вашингтон). Для анализа изображений они натренировали сверточную нейросеть, архитектура которой хорошо подходит для анализа изображений. С помощью нейросети детали на изображении классифицировали на четыре группы: здания, дороги, озелененные места и водные поверхности. Все города разделили на примерно 1695 районов в зависимости от количества объектов каждой из четырех групп.

Затем полученные данные использовали для того, чтобы провести корреляцию с реальными данными о задокументированных случаях ожирения в каждом из городов: ученые собрали данные о людях с индексом массы тела от 30 кг/ми выше. Ученые выяснили, что различия в антропогенной среде каждого района объясняют примерно 64,8 процента различий в доле людей с ожирением. 

Исследователям также удалось выделить признаки, характеризующие районы с высоким и низким уровнем ожирения жителей. Так, в более зеленых и водных областях, а также в центре города людей с избыточным весом оказалось меньше, чем в менее застроенных пригородах.

Авторам, таким образом, удалось показать эффективность использования автоматического анализа изображений с помощью сверточной нейросети для предсказания ожирения у жителей определенных местностей. Ученые также отметили, что предложенный ими метод объясняет предрасположенность людей, живущих в определенном районе, к ожирению лучше, чем данные о наличии в нем спортзалов и ресторанов быстрого питания. 

По данным, снятым со спутника, можно научиться определять и многое другое. К примеру, прошлой осенью ученым удалось построить модель, которая предсказывает политические предпочтения жителей определенных областей американских городов по автомобилям, на которых они ездят. Например, они выяснили, что владельцы пикапов чаще голосуют за республиканцев.

Елизавета Ивтушок

Нашли опечатку? Выделите фрагмент и нажмите Ctrl+Enter.