Специалисты из компании NVIDIA разработали нейросетевой алгоритм для генерации реалистичных изображений. В частности, программа на основе генеративно-состязательной нейросети создает портреты. Одна из основных особенностей алгоритма заключается в том, что обе нейросети наращивали количество слоев и разрешение изображения постепенно, что позволило достичь высокого качества деталей на конечных изображениях. Разработка будет представлена на конференции ICLR 2018, а посвященная ей статья опубликована на сайте NVIDIA.
Нередко в нейросетевых проектах, создающих или обрабатывающих изображения, используют генеративно-состязательные нейросети. Они состоят из двух нейросетей: одна из них занимается непосредственно созданием или изменением изображения, а вторая оценивает получившийся результат, сравнивая его с эталонами. За счет такой «гонки качества» сети постоянно улучшают создание и оценку изображений, в результате чего качество конечных изображений растет.
Ранее такой тип нейросетей использовали и для манипуляций с фотографиями лиц, к примеру, для создания портретов из набросков лиц, или превращения женских лиц в мужские и наоборот, но качество таких изображений было невысоким. Специалисты из исследовательского подразделения NVIDIA научились создавать таким методом качественные изображения с большим количеством деталей и разрешением, изменив подход к обучению такого типа нейросетей. Они решили постепенно наращивать разрешение изображений, создаваемых нейросетью. Использованная ими схема подразумевает, что разрешение изображения одновременно увеличивается у генератора и дискриминатора (часть, отвечающая за оценку изображения генератора), и таким образом они зеркальны другу.
В качестве тренировочных данных исследователи взяли несколько больших открытых наборов размеченных данных: датасет CELEBA, содержащий множество фотографий знаменитостей, набор данных LSUN с фотографиями комнат, и CIFAR10, содержащий разные типы изображений. Исследователи смогли с помощью большого объема данных и постепенного роста изображения получить нейросеть, которая умеет создавать изображения людей с большим количеством деталей и разрешением 1024 на 1024 пикселя.
Также исследователи опубликовали часовое видео, иллюстрирующее работу алгоритма:
Ранее генеративно-состязательные нейросети научили и другим интересным манипуляциям с изображения, к примеру, создавать из одной фотографии в короткое видео, показывающее как будут развиваться события в ближайшие мгновения, или превращать картины известных художников в фотографии и наоборот.
Григорий Копиев
Она хороша в программировании и меньше галлюцинирует
Компания OpenAI представила новую флагманскую систему алгоритмов GPT-5, которая в ближайшее время заменит модели предыдущего поколения в ChatGPT. Пятое поколение GPT представляет собой единую систему, которая в зависимости от сложности запроса в реальном времени решает: быстро дать ответ, либо задействовать более глубокие рассуждения. GPT-5 демонстрирует повышенную производительность в программировании, написании текстов и ответах на вопросы, связанные со здоровьем, а также значительно реже галлюцинирует по сравнению с предыдущим поколением моделей OpenAI. GPT-5 будет доступна для всех пользователей ChatGPT, включая бесплатных, с ограничениями на количество запросов в зависимости от уровня подписки. Подробности опубликованы в блоге компании и системной карточке модели.