Компьютер научили «приближать и улучшать» пикселизованное изображение

Николай Воронцов

Специалисты исследовательского проекта Google Brain, который занимается разработками в области искусственного интеллекта и методов глубокого обучения, научили нейросеть «додумывать» изображение, генерируя его на основе нескольких пикселей. Препринт доступен на arXiv.org.

Вызов: национальная премия в области будущих технологий.

В художественных фильмах нередко используется прием «приблизить и улучшить», в результате которого в распоряжении героев оказывается изображение высокого разрешения, восстановленное из нескольких пикселей. На практике такое невозможно, однако исследователи из Google показали, что на основе пикселизованного изображения низкого разрешения можно не восстановить, а построить заново картинку, которая может быть очень похожей на реальное изображение.

Для улучшения изображения авторы использовали две сверточные нейросети, обученные на одинаковых наборах данных. Для тренировки использовались изображения из библиотек CelebA (двести тысяч фотографий лиц знаменитостей ) и LSUN Bedrooms (два миллиона фотографий спален), картинки были уменьшены до двух размеров: 32×32 пикселей (высокое разрешение) и 8×8 пикселей (низкое разрешение).

При «восстановлении» изображения из картинки низкого разрешения главная нейросеть (prior network) отвечает за генерацию деталей картинки высокого разрешения, а вторая нейросеть — нейросеть условий (condition network) — отвечает за маппирование, сравнивая изображение низкого разрешения с уже известными картинками высокого разрешения. Фактически, благодаря нейросети условий главная нейросеть «понимает» что несколько коричневых пикселей исходного изображения нужно превратить в волосы на картинке высокого разрешения.

В результате программа из 64 цветных пикселей генерирует реалистичное изображение разрешением 32×32, которое отличается от исходной фотографии высокого разрешения. При этом некоторые изображения получились более правдоподобными, чем оригинальные фотографии — для проверки реалистичности изображения были привлечены добровольцы, которые после короткого обучения должны были указать, какая из картинок в паре является настоящей фотографией.

По результатам опроса выяснилось, что испытуемые приняли за настоящие фотографии сгенерированные изображения знаменитостей в 10 процентах случаев, для фотографий спален этот показатель составил 28 процентов. При этом традиционные методы увеличения разрешения, такие как добавление пикселей по цвету соседних и бикубическая интерполяция, вообще не смогли «обмануть» испытуемых.

Ранее британская компания Magic Pony Technology демонстрировала интересные результаты «додумывания» исходного изображения с помощью методов машинного обучения, однако никаких технических подробностей о функционировании программы не сообщалось.

Николай Воронцов

Нашли опечатку? Выделите фрагмент и нажмите Ctrl+Enter.

10:04 24.08.23 2.7 Роботы и дроны Технологии

Беспилотник научили парить почти без затрат энергии

Его система управления автоматически находит оптимальные точки в воздушных потоках

Андрей Фокин

Инженеры разработали алгоритм управления для беспилотников самолетного типа, который позволяет парить на восходящих воздушных потоках, расходуя в 150 раз меньше энергии, чем при активном полете с работающим двигателем. Алгоритм отслеживает и подстраивается под непрерывно изменяющиеся воздушные потоки, сохраняя высоту. Препринт доступен на arXiv.org. При поддержке Angie — первого российского веб-сервера Беспилотники самолетного типа более энергоэффективны, чем мультикоптеры. Благодаря крыльям они способны преодолевать большие дистанции и могут гораздо дольше находиться в воздухе. Причем эти параметры могут быть увеличены за счет парения — планирующего полета, в котором аппарат использует восходящие воздушные потоки для удержания в воздухе без использования тяги двигателей, аналогично тому, как это делают некоторые птицы. Группа инженеров под руководством Гвидо де Круна (Guido de Croon) из Делфтского технического университета разработала систему управления, которая позволяет беспилотникам самолетного типа без какой-либо предварительной информации о поле ветра самостоятельно находить оптимальные точки в восходящих воздушных потоках и использовать их для длительного парения с минимальным расходом энергии. В системе управления вместо обычного ПИД-регулятора используется метод инкрементальной нелинейной динамической инверсии, контролирующий угловое ускорение, подстраивая его под желаемые значения. Система управления может без изменения настроек работать и в режиме парения, и при полете с включенным двигателем во время поиска новых оптимальных точек в воздушных потоках или для компенсации резких порывов ветра. Для поиска оптимальных точек в поле ветра, в которых скорость снижения полностью компенсируется восходящим потоком воздуха, применяется алгоритм имитации отжига. Он случайно выбирает направления в пространстве пытаясь найти такую точку, в которой беспилотник может устойчиво лететь с минимально возможной тягой двигателя. Для тестов инженеры построили 3D-печатный прототип на основе модели радиоуправляемого самолета Eclipson model C. Он имеет размах крыла 1100 миллиметров и массу 716 грамм вместе с аккумуляторной батареей. В качестве полетного контроллера применяется Pixhawk 4. Помимо установленного под крылом и откалиброванного в аэродинамической трубе сенсора скорости, беспилотник имеет GPS-модуль для отслеживания положения во время полетов на открытом воздухе. В помещении применяется оптическая система Optitrack. Испытания проводились в аэродинамической трубе, возле которой установили наклонную рампу, для создания восходящего воздушного потока. Прототип запускали в воздушном потоке сначала на ручном управлении, после чего включали автопилот. Разработчики провели эксперименты двух типов. В первом они постепенно изменяли скорость воздушного потока от 8,5 до 9,8 метров в секунду при фиксированном угле наклона рампы. Во втором эксперименте скорость воздушного потока оставалась неизменной, зато менялся угол установки подиума. В обоих случаях алгоритм системы управления быстро находил в поле ветра точки, в которых мог поддерживать планирующий полет в течение более чем 25 минут, лишь изредка задействуя тягу двигателя в среднем лишь на 0,25 процента от максимальной, хотя при таких значениях воздушного потока для поддержания обычного полета требуется около 38 процентов. При изменении поля ветра из-за изменившегося угла наклона рампы или скорости воздушного потока алгоритм успешно находил и удерживал новое положение равновесия. В будущем инженеры планируют провести испытания на открытом воздухе. https://www.youtube.com/watch?v=b_YLoinHepo Американские инженеры и планетологи предложили использовать планер, способный длительное время держаться в воздухе за счет восходящих потоков и термиков, для изучения каньонов Марса. Предполагается, что такие аппараты с надувными разворачиваемыми крыльями могут стартовать с аэростата или дирижабля и затем планировать в атмосфере Марса от 20 минут до суток.