Дрон научили видеть насилие в толпе

amarjot singh / YouTube

Исследователи из Великобритании и Индии разработали систему на основе дрона, которая может выявлять насильственные действия среди людей, например, драки. Летающий над людьми мультикоптер в реальном времени передает данные с камеры на облачный сервер, на котором алгоритмы машинного обучения распознают на кадрах позы людей, характерные для насильственных действий, рассказывают разработчики в статье, которая будет представлена на конференции CVPR 2018.

Поскольку алгоритмы компьютерного зрения уже достаточно точны, их стали применять для автоматизации наблюдения и выявления преступлений. В некоторых странах системы видеонаблюдения в общественных местах используются вместе с подобными алгоритмами, помогающими распознавать людей в толпе и сверять их с базой розыска — к примеру, подобная система уже применяется в московском метро. Кроме того, есть разработки, позволяющие не только обнаруживать людей, но и анализировать их действия, например, существует алгоритм, обнаруживающий забытые вещи.

Несмотря на то, что сами по себе алгоритмы компьютерного зрения хорошо развиты, как правило они при анализе используют довольно неудобный источник данных — статично закрепленные камеры видеонаблюдения. Группа исследователей из Великобритании и Индии решила использовать для сбора данных дрон, который может летать над людьми. Стоит отметить, что авторы уже представляли подобную систему в 2014 году, но она имела гораздо меньшую точность, а распознавание велось не в реальном времени. Разработчики выбрали квадракоптер Parrot AR, оснащенный камерой, записывающей видео с разрешением 720p и частотой 30 кадров в секунду. Поскольку анализ такого видеопотока в реальном времени невозможно проводить на бортовом компьютере, данные пересылаются через интернет на облачный сервер с гораздо большей вычислительной мощностью.

Обработка изображения происходит в три этапа. Сначала кадры видео передаются разработанной в Facebook нейросети FPN, которая использует пирамиды изображений и созданные на их основе пирамиды признаков для эффективного распознавания людей на кадре независимо от их размера и фона. Затем части изображения, на которых система распознала людей, передаются сверточной нейросети, которая определяет на изображении человека 14 точек, из которых составляется упрощенная модель скелета. После этого алгоритм, использующий метод опорных векторов, анализирует вычисленное на предыдущем этапе положение частей тела и сопоставляет его с положениями, соответствующими насильственному поведению.

Преобразование кадра с видео в модель скелета

Amarjot Singh et al. / CVPR 2018

Для того, чтобы нейросеть научилась определять положение частей тела и понимать, что на кадре происходит насилие, исследователи создали датасет, состоящий из двух тысяч размеченных снимков, снятых с дрона. На снимках изображены несколько людей, примерно половина из которых вовлечены в насильственные действия: бьют или душат другого человека или направляют на него пистолет или нож. У каждого человека на снимке размечена модель скелета и подписано совершаемое им действие.

Сравнение точности распознавания с предыдущим алгоритмом

Amarjot Singh et al. / CVPR 2018

Исследователи разбили датасет на три части — 60 процентов снимков использовались для тренировки, и по 20 для проверки и тестирования. В результате средняя точность распознавания насилия оказалась сравнима с наземными аналогами — 88,8 процента. Кроме того, это значительно превосходит точность, полученную в предыдущей работе авторов, в которой, к тому же, распознавание изображений шло не в реальном времени.

Ранее китайские исследователи разработали нейросеть, способную распознавать преступников на фотографиях с точностью 89,5 процента. Для этого они использовали почти две тысячи фотографий из паспорта людей, половина из которых была преступниками. Анализ полученных в результате исследования данных показал, что существует четыре различных подтипа «преступных» лиц, хорошо отличающихся друг от друга, а лица законопослушных людей при этом кластеризовались на всего три подтипа.

Григорий Копиев

Нашли опечатку? Выделите фрагмент и нажмите Ctrl+Enter.

13:4230.06.23 1.8 Роботы и дроны

Китайцы построили телеуправляемого робобоксера с рекордно быстрой реакцией

Время отклика на команды оператора составляет около 12 миллисекунд

Андрей Фокин

Китайская компания Qibo Robot из города Вэйхай разработала прототип телеуправляемого робота со сверхбыстрым откликом для боксерских поединков под названием QIBBOT. Робот массой 140 килограмм повторяет движения за оператором с временной задержкой около 12 миллисекунд, что меньше, чем у других существующих на сегодняшний день телеуправляемых роботов схожих размеров, сообщает на сайте журнала IEEE Spectrum. Такого результата разработчикам удалось достичь за счет оптимизации распределения массы, актуаторов и настройки контроллеров управления. У робота есть голова, торс, цилиндрическое тело и только одна правая рука длиной 150 сантиметров с боксерской перчаткой на конце. Высота робота составляет 190 сантиметров. Информация о внутреннем устройстве робота и его нижней части не приводится. Управление боем происходят с помощью VR системы, которая отслеживает движения игрока. В качестве спарринг-партнера выступает аналогичный по конструкции робот, но находящийся под управлением компьютера. Он способен отслеживать движения противника и подстраиваться под них, выбирая стратегию нападения и защиты. По словам разработчиков, текущий прототип имеет ряд недостатков, таких, например, как низкую точность ударов и подверженность вибрациям, которые планируется исправить к следующей версии, которая помимо прочего будет иметь вторую руку. Быстрый отклик важен для поединка роботов на ринге, однако не имеет смысла, если речь идет об удаленном управлении роботом, находящемся на Луне.