Движения губ повысили надежность распознавания голоса смартфоном

Linghan Zhang et al. / Proceeding CCS '17 Proceedings of the 2017 ACM SIGSAC Conference on Computer and Communications Security

Безопасность распознавания голоса на смартфонах можно повысить без применения специального оборудования. Американские исследователи предложили использовать динамик и микрофон смартфона в качестве доплеровского радара, и измерять с его помощью уникальные для каждого пользователя особенности движения губ и языка, сообщается в работе, представленной на конференции CCS’17.

В большинстве современных смартфонов установлен голосовой помощник, позволяющий выполнять многие действия на устройстве с помощью голосовых команд. Такие приложения умеют запоминать голос владельца и реагировать только на него, в том помощник может разблокировать устройство без ввода пароля или прикладывания отпечатка пальца. Из-за этого специалисты по информационной безопасности тестируют возможные пути обмана таких систем с помощью записи голоса владельца.

Исследователи под руководством Цзе Яна (Jie Yang) из Университета штата Флорида предложили использовать для идентификации пользователя по его голосу дополнительный биометрический признак — уникальные особенности движения частей губ и языка во время речи. Главное преимущество такого метода заключается в том, что для этого не нужно использовать дополнительное оборудование. Разработчики предложили использовать динамик и микрофон, которые есть в любом смартфоне, в качестве доплеровского радара.

Он работает следующим образом. Динамик смартфона испускает незаметные для человеческого уха ультразвуковые волны. При взаимодействии этих волн с двигающимися во время речи губами и языком частота колебаний меняется в зависимости от скорости движения. Таким образом, записывая отраженные волны на микрофон, можно составить речевой «отпечаток» конкретного человека.

Исследователи протестировали надежность своей системы, пригласив 21 добровольца. Они попросили участников тестирования по несколько раз произнести 10 кодовых фраз, состоящих из нескольких слов. Затем исследователи провели атаки двух типов на систему: в первом случае они воспроизводили записи кодовых фраз из динамика, а во втором показывали одним участникам видеозапись произношения других добровольцев, и просили их произнести ту же самую фразу с максимально похожим произношением. В обоих случаях точность определения пользователя составила 99,3 процента.

Недавно китайские специалисты в области информационной безопасности разработали обратную технологию. Они научились незаметно управлять голосовыми помощниками смартфонов, воспроизводя команды в ультразвуковом диапазоне, которые в за счет нелинейных искажений превращались в самом микрофоне смартфона в звуковые колебания с новыми частотами, воспринимаемыми микрофоном. Также на конференции CCS’17 была представлена другая интересная технология биометрической аутентификации, основанная на звуковых колебаниях. Исследователи создали систему ввода пароля, которая определяет не только сам факт прикосновения, но и его индивидуальные характеристики: силу нажатия, площадь контакта и другие.

Григорий Копиев

Нашли опечатку? Выделите фрагмент и нажмите Ctrl+Enter.