Сотрудники Google Brain и исследовательской компании OpenAI создали метод обмана распознающих изображения нейросетей, который работает даже в офлайне — получаемые им изображения обманывают компьютер не только когда их напрямую «скармливают» нейросети, но и тогда, когда их распечатывают, фотографируют и только потом пытаются распознать. Описание нового метода и исследование его применимости опубликовано в архиве препринтов arXive.org
Речь идет о изображениях-обманках (adversarial examples), которые можно сделать на основе любой исходной картинки. Для человека такие изображения почти не отличимы от оригинала, однако в них внесены некоторые изменения, которые существенно усложняют их распознавание нейросетью. Потенциально, такие изображения можно использовать для обхода автоматических фильтров спама, систем распознавания лиц или для подделки биометрии.
Методы создания обманок для нейросетей разного типа (распознающих не только изображения, но и, например, звуки) исследуются как минимум с 2004 года. Традиционно для этого используются соперничающие нейросети, одна из которых стемится создать обманку, а другая — правильно ее идентифицировать (отсюда терминология adversarial examples, т. е. соперничающих примеров). Однако важные практические результаты в этой области получены только в последние несколько лет. Например, в одном из исследований ученым удалось модифицировать музыкальные аудизаписи таким образом, что нейросеть смартфона могла их идентифицировать и исполнять как голосовые команды, в то время как человек вообще не замечал постороннего вмешательства в музыку.
В области распознавания изображений подобные эксперименты также уже проводились, однако до сих пор они преимущественно оставались in silico, то есть изображения-обманки напрямую передавали нейросети для распознавания. Однако технология создания обманок подразумевает введение очень тонких, незаметных изменений, которые могут теряться при масштабировании, затенении, обесцвечивании и других искажениях, которые неизбежно появляются при фотографировании через камеру. Поэтому неизвестно, насколько создание обманок может быть опасно для нейросетей в реальной жизни. В новой работе ученые исследовали устойчивоть существующих методов создания обманок к подобным искажениям и разработали новый алгоритм, который делает обманки гораздо эффективнее известных аналогов.
За основу в работе были взяты изображения из стандартной базы ImageNet, которые ученые модифицировали одним из трех алгоритмов и затем отдавали на распознавание неросети Google’s Inception v3. Часть изображений нейросеть получала напрямую, часть авторы статьи распечатывали на бумаге и фотографировали на камеру современного смартфона. В работе ученые проверяли, как влияет на уровень ошибок нейросети не только тип алгоритма, но и степень контрастности, яркости и «замыленности» снимков.
Оказалось, что пропущенные через камеру обманки действительно оказываются существенно менее «обманными», чем при передаче нейросети напрямую. Тем не менее, уровень ошибок нейросети на обманках все равно остается очень высоким. Если обычно Inception v3 демонстрирует точность более 95 процентов, то на обманках эта цифра падает до 36-69 процентов правильных ответов, — в зависимости от конкретного алгоритма подготовки обманки. Для сравнения, при передаче изображения нейросети напрямую лучшие из использованных алгоритмов сбивают точность почти до нуля.
Что касается эффективности разных методов создания обманок, то она оказалась весьма неодинаковой для простых-и-быстрых и сложных-и-медленных алгоритмов. Наиболее эффективные обманки производил метод, который не просто увеличивал энтропию снимка, но путем внесения мелких изменений направлял нейросеть на наиболее далекий от оригинала предмет. «Традиционные методы [создания обманок] дают неинтересные ошибки вроде определения ездовых собах одной породы как ездовых собак другой породы. [Наш новый метод наименее похожего класса] дает гораздо более интересные ошибки вроде распознавания собаки как аэроплана» — пишут авторы в статье.
Александр Ершов
Он предназначен для разгрузки грузовых полуприцепов и контейнеров
Японская компания Mujin, занимающаяся разработкой роботов для работы на складах и систем управления для них, показала работу своего робота TruckBot, предназначенного для разгрузки содержимого трейлеров и грузовых контейнеров. Видео доступно на YouTube-канале компании. Разгрузка содержимого автомобильных полуприцепов и грузовых контейнеров на складах и в логистических центрах может требовать довольно много времени, выступая в роли «бутылочного горлышка», из-за которого в цепочке поставок возникают задержки. Кроме того, зачастую эта физически изнурительная работа выполняется рабочим персоналом вручную, что может представлять угрозу для здоровья людей. Решением этих проблем мог бы стать робот TruckBot, который разрабатывается японской компанией Mujin. Основанная в 2011 году в Токио компания специализируется на создании роботов для складских и логистических работ, а также разработке систем управления для них. Робот TruckBot предназначен для разгрузки грузовых прицепов и контейнеров. Основной элемент его конструкции — подвижная грузовая стрела с транспортерными лентами и роликами наверху. Стрела может отклоняться по вертикали и горизонтали, а также двигаться вперед вместе с рамой робота, проникая вглубь разгружаемого грузового контейнера или прицепа на расстояние до 15 метров. Система управления определяет с помощью камер положение объекта в грузовом контейнере. После этого стрела подводится к объекту и с помощью вакуумных присосок захватывает, подтягивает и устанавливает его на транспортерную ленту. По ней груз попадает на конвейер, установленный позади робота, который перемещает его дальше, например, на сортировку. Таким образом TruckBot способен разгрузить 1000 единиц груза, каждый массой до 22 килограмм за час работы. TruckBot может работать самостоятельно или быть частью группы, состоящей из нескольких роботов разного назначения и конвейеров, объединенных в единую систему, предназначенную для разгрузки, погрузки, сортировки, паллетирования и депаллетирования грузов. Для управления этой системой служит другая разработка компании — система управления MujinController. Использование специализированных роботов, таких как TruckBot, разработанных для выполнения одной конкретной задачи, способно повысить эффективность работы. Однако, их установка может потребовать внесения изменений или даже перестройки помещений. Человекоподобные роботы, созданием которых в последнее время занимается все больше компаний, будут лишены такого недостатка. Благодаря своей антропоморфности они способны передвигаться по тем же помещениям и взаимодействовать с теми же инструментами, что и люди, без необходимости что-либо специально изменять. Например, недавно американская компания Apptronik представила раннюю версию человекоподобного робота Apollo для складской работы.