Программу с открытым кодом научили распознавать человека по десятку фотографий

Исследователи из Университета Карнеги — Меллона на базе исследования по Google разработали проект с открытым исходным кодом, способный распознавать людей после тренировки на небольшом количестве фотографий. Демонстрационное видео опубликовано на YouTube, исходный код доступен в репозитории GitHub.

При анализе полученного изображения алгоритм находит область лица и масштабирует ее, после чего на изображение накладывается несколько десятков графических фильтров, позволяющих выделить в кадре черты лица. После этого алгоритм строит карту точек, отмечающих взаимное расположение черт лица, и сравнивает ее с уже имеющимися в базе данными.

При небольших объемах данных нейросеть справляется с распознаванием и отслеживанием лица в режиме реального времени. Например, в демонстрационном ролике алгоритм справляется с задачей распознавания, имея в распоряжении всего 10 фотографий человека.

Для тренировки нейросети разработчики использовали около шести тысяч фотографий десяти знаменитостей. Несмотря на то, что все фотографии сделаны в разных условиях и с разных ракурсов, точность распознавания алгоритма достигала 87 процентов. Авторы отмечают, что точность распознавания возрастет при использовании большего объема данных для тренировки.

Ранее ученые из Технологического института Карлсруэ представили нейросеть, способную узнать человека по инфракрасному изображению низкого разрешения. Также существует алгоритм исследователей из Университета Патры, позволяющий по инфракрасному изображению лица определить степень опьянения человека.