Apple впервые поделилась своими успехами в машинном обучении

Николай Воронцов

Исследователи из Apple разработали метод улучшения синтетических изображений, предназначенных для тренировки нейросети. Это первая официально опубликованная в общем доступе работа, касающаяся разработок компании, препринт доступен на arXiv.org.

Вызов: национальная премия в области будущих технологий.

Apple вплоть до недавнего времени придерживалась закрытой политики и информация о различных исследовательских работах компании, в том числе в сфере машинного обучения, не публиковалась в открытых источниках. Однако в декабре Руслан Салахутдинов, недавно возглавивший в Apple исследовательское подразделение, отвечающее за разработки в области искусственного интеллекта, заявил, что компания меняет свою политику и теперь работы будут публиковаться, а сотрудники смогут открыто взаимодействовать с научным сообществом.

В первой опубликованной Apple работе описывается метод улучшения синтетических размеченных изображений, которые используются для быстрого обучения нейросетей. При обучении крайне важен объем и качество данных, на примере которых обучается программа, однако в некоторых случаях подходящей информации может попросту не оказаться в нужном объеме — например, для тренировки нейросети, которая поможет управлять различными устройствами взглядом, необходимо большое количество размеченных фотографий глаз. Разметка больших баз вручную — трудоемкий процесс, поэтому исследователи, решающие подобные задачи, нередко используют вместо реальных фотографий рендеры изображения глаз.

У нейросетей, натренированных на синтетических изображениях, проявляется новая слабость — они хуже распознают реальные фотографии, поскольку они не использовались в обучении или использовались в значительно меньшем количестве, чем синтетические. Одно из возможных решений — использовать бóльшие вычислительные мощности при создании изображений для повышения их реалистичности, однако такой метод ведет к ощутимому удорожанию работы.

Чтобы решить существующие проблемы с генерируемыми изображениями разработчики из Apple решили использовать промежуточную нейронную сеть, которая помогает создавать набор данных для обучения. Программа использует размеченное синтетическое изображение и неразмеченную реальную фотографию для создания на выходе нового улучшенного изображения, которое сохраняет в себе направление взгляда и разметку от синтетического. Фактически, стиль фотографии переносится на сгенерированное изображение глаза — подробнее о том, как нейросети могут переносить стиль одного изображения на другое, можно прочитать в материале N+1 «На выставке Ван Гога».

Для проверки эффективности и правдоподобности улучшенных таким образом изображений авторы показывали десяти испытуемым 50 реальных фотографий и 50 улучшенных сгенерированных изображений. Одновременно каждый доброволец видел 20 картинок из обеих категорий и должен был отметить реальные и сгенерированные изображения. В результате из 1000 изображений испытуемые правильно отметили 517 (p = 0,148), что практически не отличается от случайного угадывания. В то же время, при демонстрации синтетических изображений без улучшения и реальных фотографий добровольцы отнесли к верной категории 162 картинки из 200 (p ≤ 10^-8), что существенно отличается от случайного угадывания.

Кроме проверки с помощью добровольцев авторы также проверили эффективность новых изображений с помощью нейросети, которую натренировали на улучшенных картинках. Алгоритм, обучавшийся на улучшенных изображениях, показал результат распознавания направления взгляда на 22,3 процента выше, чем такая же нейросеть, натренированная на обычных синтетических изображениях. Кроме того, «улучшенная» нейросеть точнее справилась с определением направления взгляда, чем другие алгоритмы, натренированные на реальных фотографиях из датасета MPIIGaze.

Правильное определение направления взгляда может быть использовано для управления устройствами в самых разных сферах — например, для перемещения в VR-играх, предсказывания маневров водителей до их совершения или управления военными беспилотниками.

Николай Воронцов

Нашли опечатку? Выделите фрагмент и нажмите Ctrl+Enter.

19:24 08.09.23 2.3 Роботы и дроны Технологии

Мягкую робогусеницу отправят на поиски неисправностей внутри авиационных двигателей

При этом не потребуется демонтаж и разборка

Андрей Фокин

Инженеры GE Aerospace Research разработали мягкого робота Sensiworm для обследования технического состояния авиационных двигателей. Робот способен ползать подобно гусенице по вертикальным поверхностям и даже потолку, передавая оператору видеоизображение в реальном времени. С помощью Sensiworm технические специалисты смогут оценивать текущее состояние авиамоторов без необходимости их демонтажа с самолета, сообщает New Atlas. При поддержке Angie — первого российского веб-сервера Современные турбовентиляторные двигатели требуют регулярного обслуживания. Они состоят из огромного количества деталей, тщательно изучить состояние которых без снятия двигателя с самолета даже с помощью эндоскпов (бороскопов) порой невозможно. При этом демонтаж мотора и его последующая разборка занимают много времени, в течение которого самолет простаивает на земле. Поэтому инженеры давно работают над альтернативными способами обследования авиадвигателей изнутри без их демонтажа. Одна из таких разработок принадлежит инженерам исследовательского отдела компании General Electric GE Aerospace Research, которые совместно с сотрудниками Университета Бингемтона разработали мягкого робота Sensiworm (Soft ElectroNics Skin-Innervated Robotic Worm) для обследования технического состояния авиационных двигателей изнутри. Вытянутый корпус Sensiworm состоит из мягкого полимерного материала, который способен растягиваться и сокращаться с помощью источника давления. Способ передвижения Sensiworm напоминает движения гусеницы пяденицы. Робот может передвигаться не только по горизонтальным и вертикальным поверхностям, но также и по потолку. Для этого он использует две присоски, расположенные в передней и задней части корпуса. Таким образом Sensiworm может добраться до труднодоступных мест внутри двигателя, включая лопатки компрессоров и турбин. https://www.youtube.com/watch?v=_Mks06p0KVo Внутри автономной версии Sensiworm, помимо собственных источников питания, давления и бортового компьютера, находится камера с источником света, а также другие сенсоры, необходимые сервисным специалистам. Робот может автоматически обнаруживать и обходить препятствия (технических деталей того, как это происходит, разработчики пока не сообщают). По словам создателей Sensiworm, робот должен выполнять роль дополнительных глаз и ушей, исследуя внутренности авиадвигателей на предмет неисправностей, коррозии и повреждения теплоизоляционного покрытия. Разработчики считают, что в будущем он сможет не только передавать изображение интересующих участков в реальном времени, выполняя роль продвинутого варианта бороскопа, но и сможет производить мелкий ремонт. Внутренней инспекции требуют не только такие сложные устройства как авиадвигатели, но даже трубопроводы. Китайские инженеры разработали миниатюрного робота для инспекции внутреннего состояния трубопроводов диаметром меньше сантиметра. Робот состоит из цилиндрических модулей, приводимых в движение актуаторами на основе диэлектрических эластомеров.