Компьютер научили находить депрессивных пользователей Instagram

Американские исследователи успешно использовали машинное обучение для выявления маркеров депрессии в фотоснимках пользователей Instagram. Препринт исследования доступен на сайте arXiv.org.

Сотрудники Гарвардского и Вермонтского университетов провели онлайновый опрос пользователей Instagram, включающий определение депрессии по шкале Центра эпидемиологических исследований (CES-D). После этого они попросили участников с признаками клинической депрессии и без них поделиться своими публикациями за все время пользования сервисом.

В результате ученые собрали для анализа почти 44 тысячи фотографий 166 пользователей (71 с депрессией и 95 здоровых). По этим публикациям они собрали следующую информацию: степень активности каждого пользователя (число публикаций в день), реакцию сообщества (число «лайков» и комментариев), наличие и количество лиц на фотографиях, характеристики изображения (тон, насыщенность и яркость) и метаданные (примененные фильтры).

Поскольку у исследователей были данные о том, кто из пользователей страдает депрессией, они смогли использовать машинное обучение с учителем (при котором ученым известен правильный ответ) для того, чтобы оценить предсказательную силу этих факторов.

Выяснилось, что основными признаками депрессии служат тона, близкие к синей части спектра, а также низкие значения яркости и насыщенности. Также у людей с этим заболеванием оказалось больше фотографий с лицами, однако количество лиц на них было меньше, чем на снимках здоровых людей. К публикациям людей с депрессией было больше комментариев, но меньше «лайков». Кроме того, при депрессии люди в целом реже использовали фильтры и предпочитали Inkwell, преобразующий снимки в черно-белые. Здоровые пользователи чаще всего пользовались фильтром Valencia, который делает фото светлее.

Исследование, выполненное другими авторами ранее, показало, что врачи общей практики могут выявить у пациента депрессию в 42 процентах случаев и исключить ее у здоровых людей в 81 проценте случаев. Анализ предсказательной силы двух полученных учеными моделей показал, что одна из них (в которой использовали фотографии за все время пользования соцсетью) превосходит врачей по выявлению пациентов с депрессией (она верно определила 70 процентов из них), однако чаще дает ложноположительные заключения. Вторая модель (с использованием только снимков, опубликованных до постановки диагноза) смогла выявить лишь треть больных, однако практически не давала ложноположительных заключений.

Как пишут авторы работы, полученные результаты свидетельствуют о том, что визуальные социальные сети могут стать ценным инструментом для скрининга и раннего выявления психических расстройств.

Публикации в социальных сетях неоднократно использовались учеными для выявления различных заболеваний и состояний, причем многие из этих исследований были посвящены депрессии. Однако их авторы использовали данные текстовых, а не визуальных соцсетей, и не прибегали к помощи машинного обучения. Помимо депрессии, публикации пользователей помогали ученым выявлять послеродовые эмоциональные нарушения, злоупотребление алкоголем, посттравматическое стрессовое расстройство, суицидальные наклонности и рак поджелудочной железы, а также предсказывать эпидемическое распространение инфекций.

Олег Лищук