Программист Зак Тутт (Zack Thoutt) создал нейросеть, которая предсказывает события шестой книги Джорджа Р. Р. Мартина «Ветра зимы». Программа самостоятельно написала пять глав — они опубликованы на сайте GitHub. Подробнее об этом рассказывает Motherboard.
Книга «Ветра зимы» должна стать шестой и предпоследней частью саги «Песнь Льда и Пламени». Фанаты ждут публикации романа еще с 2012 года, однако Мартин недавно в своем блоге сообщил, что он надеется выпустить книгу лишь в 2018 году. Новая часть должна содержать главы, рассказывающие о событиях с точки зрения Сансы Старк, Арьи Старк, Арианны Мортелл, Эйерона Грейджоя, Теона Грейджоя, Виктариона Грейджоя, Тириона Ланнистера и Барристана Селми.
Для того, чтобы создать альтернативное продолжение серии, Зак Тутт использовал LSTM-нейросеть. Она представляет собой подвид реккурентных нейросетей, которые идеально подходят для работы с текстом. Благодаря наличию обратной связи и способности обучаться долговременным зависимостям LSTM-нейросеть может работать с контекстом в длинных предложениях. Кроме того, она хранит информацию в течение продолжительного периода времени — это помогает ей создавать связное повествование и не повторяться.
Для обучения программы Тутт использовал первые пять книг саги «Песнь Льда и Пламени» — всего 5376 страниц. Каждая глава нового романа начиналась с имени персонажа, заданного автором, а дальше нейросеть сама продолжала рассказ. Как поясняет программист, он хотел сохранить стиль повествования Джорджа Мартина — от третьего лица с точки зрения одного из героев.
Система искусственного интеллекта написала пять глав определенной длины. Из-за того, что обучающего материала было немного — около 30 тысяч уникальных слов — программа допускает грамматические ошибки и подбирает странные сочетания слов. Тем не менее, некоторые предположения нейросети оказались весьма точными: например, что Джейме Ланнистер убьет свою сестру и одновременно любовницу Серсею, Джон Сноу оседлает дракона, а советник Варис убьет Дейнерис Таргариен. Все эти теории обсуждались фанатами сериала «Игра престолов».
«Джейме убил Серсею и был холоден и полон слов, и Джон подумал, что он теперь волк, и белая гавань...»
По словам Тутта, нейросеть писала бы лучше, если бы для ее тренировки использовалась книга в сто раз превосходящая объем всей серии. Особенно программист отмечает стиль Мартина — описательный, со множеством прилагательных, что осложняет работу системы искусственного интеллекта. Изначально Тутт хотел использовать для обучения и другие источники, например телевизионные сценарии, однако в итоге он отказался от этой идеи. Включение стилей сценариев сериала испортило бы исходный материал и лишь усложнило бы работу программы.
В нашей серии материалов мы рассказывали о вселенной «Игры престолов» с точки зрения разных наук. Вы можете почитать об устройстве пройти тест и поставить диагнозы героям «Песни Льда и Пламени».
Кристина Уласович