Разработчики из Бельгии и США представили алгоритм, который превращает селфи в портреты, сделанные сторонним фотографом. Для этого система анализирует позу человека на снимке с помощью стороннего алгоритма, подбирает наиболее похожую портретную позу и восстанавливает изображение уже с ней. Препринт статьи опубликован на arXiv.org.
Фронтальные камеры современных смартфонов сейчас позволяют делать довольно качественные селфи — без использования сторонней помощи и штативов. При этом все равно остается другая проблема — нарушенная композиция: селфи выглядят менее естественно, чем обычные портретные кадры (на них, например, часто видна вытянутая рука), а также с помощью них редко удается запечатлеть себя самого в полный рост или хорошо снять фон.
Как минимум одну проблему — неестественную позу на селфи — можно немного подправить с помощью дополнительной обработки: например, кадрировать так, чтобы не было видно вытянутую руку. Можно сделать то же самое и с помощью алгоритмов компьютерного зрения — и один такой алгоритм представили исследователи под руководством Лицянь Ма (Liqian Ma) из Лёвенского католического университета в Бельгии.
В основе их системы — алгоритм DensePose, который автоматически определяет позу человека на снимке (в прошлом году его, к примеру, использовали для создания интерактивной компьютерной игры с живыми теннисистами). Двухмерная проекция позы затем сравнивается с остальными позами в базе данных: с помощью метода k-ближайших соседей алгоритм находит естественную позу, наиболее похожую на изначальную по положению верхней части торса, дорисовывает ее и вставляет в кадр обратно.
Для обучения алгоритма исследователи собрали датасет из 23 тысяч портретных фотографий и 4,6 тысячи селфи. После обучения первой части системы, подбирающей необходимую позу (обучение проходило без учителя), поза достраивается на итоговом снимке попиксельно на основе изображения тела на оригинальном селфи — для этого используется сверточная нейросеть.
Полученные изображения затем сравнили с двумя другими существующими методами: например, основанными на «круговых» генеративно-состязательных нейросетях CycleGAN. Для этого полученные изображения показывали 20 добровольцам и просили оценить, насколько натурально они выглядят: по сравнению с остальными способами, добровольцы выбирали новый метод восстановления портретов в 79–82 процентах случаев (в зависимости от метода).
Тем не менее, у алгоритма все же есть некоторые ограничения: он не всегда может подобрать похожую позу, и в таких случаях плечи или руки на портрете получаются слишком узкими. Это, однако, по словам исследователей, происходит только в десяти процентах случаев.
Довольно часто селфи изучают и в социокультурном контексте: например, в 2016 году ученые подсчитали, что с годами число смертей во время съемки селфи растет. Главной причиной смерти назвали падение с высоты, а лидером по числу смертей оказалась Индия.
Елизавета Ивтушок
Что такое опенсорс и почему он важен для IT-индустрии
Наверняка вам доводилось слышать выражение «опенсорс». Может быть, вы даже понимаете, что под этим термином скрывается «программное обеспечение с открытым исходным кодом». Но какие возможности такая открытость дает разработчикам и почему может быть выгодна обыкновенным пользователям? Рассказываем о разработке и значимости опенсорс-проектов.