Разработчики из США и Гонконга представили DeepService — систему, которая определяет пользователя по тому, как он пользуется клавиатурой смартфона. Алгоритм новой системы работает на основе глубокого обучения, а сам процесс идентификации занимает меньше, чем одну миллисекунду. Препринт статьи доступен на сайте arXiv.
Традиционно для идентификации пользователя (с целью, например, предложить ему интересный контент) в сети используются файлы cookie — небольшие фрагменты данных, которые хранятся на устройстве (компьютере или смартфоне) и посылаются веб-серверу в начале сеанса. Политика использования таких файлов у большинства сайтов открыта: сайты предупреждают пользователя об использовании cookie. Они, однако, не всегда могут эффективно распознать пользователя: например, если человек посетит сервис под другим аккаунтом или с нового устройства, то распознать его будет сложно.
С другой стороны, большинство современных смартфонов собирают достаточно биометрических данных пользователей, чтобы их можно было использовать для эффективной идентификации — и даже переносить ее на другие устройства и аккаунты. Команда разработчиков из США и Гонконга, под руководством Алекса Лио (Alex D. Leow) в своей новой работе представила систему идентификации пользователя на основе того, как он пользуется клавиатурой.
Разработчики использовали глубокое обучение на основе работы долгосрочной короткой памяти — разновидности архитектуры рекуррентных нейросетей, которая может использовать сравнительно давнюю информацию. В качестве обучающей выборки ученые использовали данные, полученные от 40 пользователей: их просили в течение 8 недель пользоваться смартфонами, в которые была загружена специальная клавиатура. Такая клавиатура записывала информацию о том, как пользователь печатает: например, длину и скорость удара по клавише, время между ударами, а также данные с акселерометра — то есть, положение экрана во время печатания. Авторы отмечают, что из этических соображений информация о том, что именно печатают участники, не использовалась.
В результате ученые выяснили, что новый алгоритм идентификации на основе исключительно данных о пользовании клавиатурой, может очень быстро и правильно определить пользователя по манере использования клавиатуры — с точностью более 93 процентов. Авторы отмечают, что алгоритм стоит разрабатывать и далее, также в перспективе можно разработать подобный способ идентификации при использовании персонального компьютера.
Для определения пользователя можно использовать самые разные данные. Так, в нашей заметке вы можете прочитать о наушниках, которые используют для идентификации вибрацию черепа.
Елизавета Ивтушок