Мнение редакции может не совпадать с мнением автора
В этот четверг на знаменитом лондонском аукционе «Кристис» за 432,5 тысячи долларов был продан портрет некоего Эдмонда де Белами. Картина нарисована не художником, а генеративно-состязательной нейросетью, которую обучили три французских исследователя из коллектива Obvious. В своей речи по завершении продажи они поблагодарили разработчика и художника Робби Баррата, чьи работы послужили вдохновением для создания их нейросетевых картин. Портал The Verge обратил внимание на то, что алгоритм, который Obvious использовали для создания проданного портрета, был «позаимствован» у Баррата, который выложил код в открытый доступ. О подробностях этой истории и том, стоит ли вообще продавать произведения искусства, созданные нейросетью, читайте в нашем блоге.
Полмиллиона долларов — сумма для произведения искусства достаточно большая: в такую цену, к примеру, идут работы Пабло Пикассо. В особенности огромная эта сумма для абстрактного, чуть замыленного портрета неизвестного господина (мы, разумеется, не претендуем на звание знатоков современного искусства — вполне возможно, что сумма оправданна). Картину, тем не менее, все равно выставили на одном из самых известных в мире аукционов, где у нее нашелся покупатель (стартовая цена была в районе десяти тысяч долларов, что уже чуть более приемлемо, но все равно очень дорого).
Почему это произошло? Потому что картину «нарисовал искусственный интеллект», а в эру стремительного развития технологий все, что генерируется автоматически, заслуживает очень много внимания. В особенности внимание заслуживают автоматически сгенерированные произведения искусства. Для их создания в последние несколько лет широко используются генеративно-состязательные нейросети (англ. generative adversarial network, сокращенно GAN), которые состоят из двух соревнующихся друг с другом нейросетей: генератора и дискриминатора. Задача первой сети — создавать, а второй — критиковать: по ходу работы алгоритма генератор создает новые объекты, а дискриминатор сравнивает их с обучающей выборкой, к которой у генератора доступа нет. Этот алгоритм — хороший пример обучения без учителя (в самом начале генератор создает совершенно случайные наброски, а затем учится делать что-то более или менее осмысленное на основании суждений дискриминатора). К примеру, с помощью этого алгоритма можно не только создавать что-то оригинальное, но и переносить стили, скажем, между фото пейзажа и картинами Моне.
Финальный этап работы таких нейросетей во многом зависит от обучающей выборки. Допустим, GAN нужно нарисовать портрет; в этом случае ей для обучения необходимо очень много портретов: чем их будет больше, тем выше будет скорость обучения и вероятность того, что нейросеть создаст что-то свое (впрочем, все равно похожее на то, что ей «скормили»). Сбор достаточного количества релевантных данных для обучения — процесс такой же важный, как и создание самой нейросети.
Робби Баррат не только создал алгоритм своей GAN, но и предварительно натренировал ее, чем сильно облегчил задачу разработчикам: любой хоть немного разбирающийся в программировании и машинном обучении человек мог скачать исходный код и потратить совсем немного усилий на то, чтобы создать что-то оригинальное. В частности, разработчик предварительно натренировал нейросеть на базе данных пейзажей, изображений обнаженных женщин и портретах. Этим и воспользовались разработчики из Obvious: как заметил The Verge, один из них даже участвовал в обсуждении кода Баррата на github, прося внести изменения в его исходную версию. Кстати, сеть Баррата изначально делала не самые плохие портреты (по крайней мере, они не уступают проданному).
На github Баррата сказано, что все изображения, созданные с помощью его предварительно обученной нейросети, должны быть подписаны его именем; кроме того, разработчик уточнил, что созданные работы не подлежат продаже. Тем не менее, неизвестно, появилось уточнение до того, как Obvious продало свою первую работу, или нет (прежде чем добиться успеха на «Кристис», они уже продали пару работ частным коллекционерам). Сами авторы «Портрета Эдмонда де Белами» уточняют, что действительно использовали алгоритм Баррата, но при этом внесли множество дополнений, которые улучшили работу и привели к более качественному результату. Тем не менее, программист и художник Том Уайт, по просьбе The Verge повторивший процесс создания похожего портрета, отметил, что использование исходного кода Баррата без каких-либо модификаций приводит к результатам, подозрительно похожим на портрет господина Белами.
Все еще не очень понятно, оправданна или нет покупка произведений искусства от «искусственного интеллекта», но скорее всего нет. Во-первых, пример с Obvious говорит о том, что создать такое «произведение» может любой человек, хоть немного знакомый с машинным обучением. Во-вторых, таких работ за один раз можно создать тысячи — и все они будут более или менее уникальны. Кажется, это отличная идея для стартапа, но плохая новость для разработчиков. Использование чужих алгоритмов, выложенных в открытый доступ, в будущем может привести к тому, что коды начнут считаться интеллектуальной собственностью. С одной стороны, это хорошо (все-таки обидно, когда кто-то достаточно пронырливый зарабатывает полмиллиона долларов на твоем алгоритме, тогда как сам ты не сподобился это сделать), а с другой, существенно замедлит развитие машинного обучения, превратив его в сферу, в которой никто никому не доверяет.