Американские разработчики представили unCAPTCHA — алгоритм, который может обмануть аудио-капчу, используемую для слабовидящих пользователей. Алгоритм основан на различных системах распознавания речи и может расшифровать состоящую из цифр аудио-капчу с точностью 85,15 процента за 5,42 секунды. Описание работы unCAPTCHA представлено на сайте Мэрилендского университета.
Капча используется для того, чтобы выяснить, кто пытается воспользоваться каким-либо сервисом: человек или какая-нибудь программа для автоматизации действий в интернете. Самые распространенные капчи содержат текст и изображения, но также часто сопровождаются аудио для слабовидящих пользователей, которым необходимо под диктовку набрать несколько цифр. Среди сервисов, поддерживающих аудио-капчи, к примеру, — reCAPTCHA компании Google, который используется большинством современных веб-сайтов.
Разработчики из Мэрилендского университета под руководством Кевина Бока (Kevin Bock) решили создать алгоритм, который может взломать такую капчу. Алгоритм устроен следующим образом. Получив аудио-капчу, он делит ее на определенные сегменты по паузам, далее анализируя каждый из них с помощью нескольких алгоритмов распознавания речи. В случае, если один из алгоритмов сразу же предлагает определенную цифру, она записывается; если же системе кажется, что перед ней слово, то затем оно сопоставляется с цифрами, среди которых выбирается наиболее схожая фонетически.
С помощью такого алгоритма разработчикам удалось добиться точности распознавания капчи в 85,15 процента. На сайте проекта сообщается, что после того, как авторы проекта уведомили Google о работе своей системы, в аудио-капчи reCAPTCHA добавили фразы вместо перечисления цифр. Тем не менее, новая версия unCAPTCHA справляется и с ними — причем с точностью свыше 90 процентов.
Взламывать капчи можно и с помощью распознавания изображений. В 2017 году такой алгоритм представили американские исследователи: он смог расшифровать примеры reCAPTCHA с точностью в 66,6 процента.
Елизавета Ивтушок
Модель разработали в Японии
Даидзю Уэда (Daiju Ueda) с коллегами по Метропольному университету Осаки разработал модель на основе алгоритмов глубокого машинного обучения, которая эффективно выявляет жировую инфильтрацию (стеатоз) печени по рентгенограммам органов грудной клетки. В работе использовали данные 4414 пациентов двух японских клиник, которым выполнили по 6599 снимков грудной клетки и эластограмм печени с определением контролируемого параметра затухания (CAP, количественный показатель степени стеатоза). Пациентов одной из клиник случайным образом распределили в соотношении 8:1:1 в датасеты для обучения, настройки и внутреннего тестирования модели, а участники из второй клиники вошли в датасет внешнего тестирования. Результаты опубликованы в журнале Radiology: Cardiothoracic Imaging.