Программу научили работать в жанре гиперреализма

Исходное изображение (левый столбец) и примеры сгенерированных картинок на его основе

Изображение: Emily Denton et al./ arXiv.org

Группа ученых из США создала алгоритм для создания изображений, похожих на фотографии реальных объектов. Программа получает исходную картинку в небольшом разрешении (например, 4 на 4 пикселя), а затем последовательно увеличивает разрешение, добавляя на каждом шаге детали. При опросе добровольцев в 40 процентах случаев оказывалось, что люди путали сгенерированное программой изображение с реальной фотографией. Препринт исследования опубликован на сайте arXiv.org.

Для тренировки программы авторы использовали методы глубокого машинного обучения. Основная часть алгоритма была представлена двумя подсистемами. Одну из них тренировали отличать сгенерированные изображения от фотографий. При этом другую старались научить, как из случайно сгенерированного шума и заданной матрицы меньшего разрешения создать картинку, которая бы могла обмануть первую подсистему.

После обучения, ученые применяли полученный алгоритм для последовательной детализации изображений. Процесс начинался с матрицы 2×2 или 4×4 пикселя и доходил до «полного» изображения 64×64 пикселя. Такое представление изображений называется «пирамида Лапласа».

При этом ученые подчеркивают, что при создании изображений алгоритм не обучался на полноформатных картинках. Взамен, он концентрировался на каждом шаге детализации: как из одного пикселя с усредненной информацией сделать 4 (2×2) пикселя с большим количеством деталей.

Готовые изображения авторы разбили по классам и сравнили полученный результат с другими методами из этой же области технологий. Для этого они прибегли к помощи добровольцев, которым подряд показывали картинки и предлагали выбрать, «настоящая» она или «искусственная». В выборку в одинаковой пропорции входили как реальные фотографии из нескольких архивов, так и изображения, созданные разными алгоритмами. Лучший результат показала программа, созданная в рамках данной работы. В 40 процентах случаев участники эксперимента не могли отличить созданные ей картинки от фотографий.

Описанное исследование относится к области компьютерной креативности. В рамках этого раздела технологий ученые стремятся создать программы, способные к творческому процессу. Так, ранее группа авторов получила алгоритм для оценки степени креативности в художественных произведениях. Еще раньше другой коллектив научил свою программу писать тексты для рэп-музыки.


Нашли опечатку? Выделите фрагмент и нажмите Ctrl+Enter.