Инклюзивные инструменты, использующие машинное обучение
Взрывной рост популярности машинного обучения в основном связан с тем, что человечество научилось приспосабливать математический аппарат к решению прикладных коммерческих задач. Однако методы машинного обучения можно распространить и на социальную сферу.
Отличным примером адаптации методов машинного обучения к инклюзивным задачам можно назвать распознавание объектов на картинках. С этой задачей обычные люди сталкиваются, если используют функцию FaceID на смартфонах — алгоритмы машинного обучения позволяют определить, кто сейчас использует устройство. Для людей с проблемами зрения существуют методы pattern recognition, направленные на описание окружающей действительности или контента веб-сайта. Умный алгоритм может увидеть, что происходит вокруг пользователя, и озвучить это. Благодаря этим методам людям с проблемами со зрением легче ориентироваться в пространстве и взаимодействовать с окружающими.
В области распознавания звука машинное обучение также демонстрирует впечатляющие результаты. Модели, построенные на основе машинного обучения, способны распознавать и интерпретировать человеческий голос. С помощью таких методов можно автоматически генерировать субтитры, помогая людям с нарушениями слуха понимать, что происходит на видео. Помимо этого, алгоритмы распознавания звука породили целую область аудиоинтерфейсов. Благодаря им люди с нарушениями зрения могут полноценно взаимодействовать с приложениями и сайтами в интернете.
Еще одной очень важной задачей является распознавание жестового языка. Коммуникация с внешним миром на языке жестов обычно сильно осложнена, поскольку не во всех крупных организациях есть сурдопереводчики. Это приводит к проблемам в обучении и профессиональной деятельности среди слабослышащих людей. Именно эту задачу предлагается решить в рамках направления Equal AI контеста AI Journey Contest. Участники конкурса получат видеозаписи, содержащие жесты из русского жестового языка, записанные разными носителями языка: задача заключается в том, чтобы классифицировать жесты на видео.