Нейросеть научили создавать оригинальные произведения искусства

Работы креативной состязательной сети (CAN)

Elgammal et al. / arXiv 2017

Нейронная сеть научилась создавать оригинальные произведения искусства, комбинируя опыт, полученный в ходе изучения различных стилей живописи. Creative adversarial network (CAN) была разработана командой ученых из Лаборатории искусственного интеллекта и искусства (The Art & AI Laboratory) Ратгерского университета в Нью-Джерси. Принцип работы нейросети основывается на работе порождающих состязательных сетей и том, что известно ученым о когнитивных механизмах креативного процесса. Препринт статьи опубликован на сайте arXiv.

Порождающие состязательные сети (generative adversarial networks, или коротко GAN) — это разновидность нейросетей, которая состоит из двух соревнующихся систем: генератора (generator) и дискриминатора (discriminator). Задача генератора — создавать новые объекты, похожие на объекты из обучающей выборки, доступа к которой у него нет (например, это могут быть реально существующие живописные полотна). Дискриминатор отвечает за то, чтобы решить, принадлежит ли сгенерированный объект к классу объектов из доступной ему обучающей выборки, и дать соответствующий сигнал генератору.

Такая система работает по принципу игры с нулевой суммой, в которой успех одной составляющей возможен только при неудаче второй. Обучаясь на ответах дискриминатора, генератор создает объекты все более и более похожие на те, которые дискриминатор считает относящимися к обучающей выборке, что в конечном итоге приводит к победе первого и поражению второго. В случае с живописными полотнами это означает, что нейросеть в итоге начинает максимально точно подражать существующим художественным произведениям. Однако создавать новые полотна она таким образом не научится.


При работе над новой нейросетью авторы основывались на модели создания новых произведений искусства, предложенной американским психологом Колином Мартиндейлом (1943-2008). Он предположил, что задача любого художника — воздействовать на эмоциональное возбуждение его зрителей, слушателей или читателей. Состояние эмоционального возбуждения зависит от многих факторов: новизны эстетического объекта, его сложности, наличия в нем двусмысленности или его способности удивить и навести на размышления. Также при влиянии на эмоциональное возбуждение аудитории художнику важно соблюдать умеренность, чтобы, с одной стороны, его произведение не показалось скучным, а с другой — не вызвало негативной реакции из-за своей радикальной новизны.

Мартиндейл подчеркивал роль «привычности» при воздействии на эмоциональное возбуждение: при повторении одних и тех же художественных приемов есть риск, что к созданным с их помощью произведениям аудитория потеряет всякий интерес. Поэтому комбинирование различных стилей и привнесение элемента новизны — ключ к успеху любого творческого процесса.

Авторы новой работы дополнили принцип работы GAN, предложив новую разновидность нейросети — креативную состязательную сеть (creative adversarial network, коротко CAN). Нейросеть была обучена на выборке из более чем 81 тысячи картин 1119 художников различных стилей, творивших в XV–XX веках. 

Принцип работы CAN отличается от других порождающих сетей тем, что генератор получает от дискриминатора не один сигнал, а два: первый, как в классической GAN, определяет, является ли сгенерированный объект произведением искусства, схожим с теми, что даны в обучающей выборке, и к какому стилю он может быть отнесен; второй сигнал передает информацию о том, насколько близко сгенерированное изображение относится к тому или иному стилю. Так как основная цель CAN — креативность, успех ее генератора зависит от того, удастся ли ему создать новое изображение, которое дискриминатор, с одной стороны, отнесет к произведениям искусства из данной ему выборки, но с другой, не сможет определить его стиль.


В результате CAN смогла создать большое количество совершенно новых произведений искусства. Полученные изображения были продемонстрированы реальным людям, которые оценивали схожесть сгенерированных изображений с работами современного искусства, их реальность («Создана эта работа художником или компьютером?») новизну и эстетические характеристики («По шкале от 1 до 5, насколько вам нравится картина?»). Стоит отметить, что выборка опрошенных была небольшой (10 человек), однако, авторы смогли сделать первые выводы о том, что созданные CAN изображения рассматриваются как настоящие произведения искусства и превосходят в этом работы, полученные при работе классической GAN.

Ученые давно научили компьютер имитировать уже существующие объекты человеческой творчества, однако прежде произведения искусственного интеллекта еще не создавали ничего, что имело бы самостоятельную эстетическую ценность. Так, Яндекс.Автопоэт умеет писать стихи определенного размера из случайно отобранных поисковых запросов, но то, что при этом получается, далеко по эстетическому наполнению от реальной поэзии. В области живописи нейросети умеют применять стили различных известных художников к любым изображениям — чьим-то рисункам или фотографиям. Однако если в результате такой обработки и возникает что-то эстетически значимое, «соавтором» такого «произведения искусства» все равно оказывается человек. Подробнее о том, как работают такие нейросети, можно прочитать в нашем материале.

Елизавета Ивтушок

Нашли опечатку? Выделите фрагмент и нажмите Ctrl+Enter.