Пользователь Reddit под ником deepfakes месяц назад опубликовал несколько фейковых порнографических роликов с участием актрис Галь Гадот и Обри Плаза. Сейчас на ролики обратил внимание портал Motherboard.
Разработчик создал видео с помощью общедоступных библиотек TensorFlow и Keras, а также открытого алгоритма машинного обучения, аналогичного тому, который использует NVIDIA для изменения времени года на записях. Для тренировки программы использовались ролики на YouTube, стоковые снимки и картинки Google.
«Я просто придумал хитрый способ подмены лиц. Имея сотню фотографий, я могу создать миллионы искаженных изображений для обучения нейросети. После [завершения тренировки] я демонстрирую программе лицо другого человека, она начинает думать, что перед ней очередной искаженный снимок и пытается сделать его похожим на образец из обучающей выборки», — рассказал deepflakes.
Специалист по искусственному интеллекту Алекс Шампанард заметил, что сегодня хорошая видеокарта может справиться с такой задачей в течение нескольких часов. Конечно, видеозаписи еще не совсем реалистичны, и подмена легко угадывается при просмотре. Тем не менее, технологии развиваются быстро, поэтому в будущем это препятствие удастся легко преодолеть.
Кроме того, два месяца назад на Reddit также были выложены фейковые порнографические ролики с участием Эммы Уотсон, Мэйси Уильямс, Тейлор Свифт и Скарлетт Йоханссон. Редактор Motherboard связался с агентами актрис, чтобы сообщить им о публикациях. На данный момент некоторые видео уже удалили.
В прошлом году нейросеть научилась создавать изображения, которые система поиска NSFW-материалов принимает за порнографию, хотя они не имеют к ней отношения.
Кристина Уласович
Одна парализованная пациентка смогла «произносить» 62 слова в минуту, а другая — 78
Две команды ученых из США научили декодеры превращать сигналы мозга парализованных пациентов в текст в три-четыре раза быстрее, чем удавалось прежде. Статьи об этом [1, 2] опубликованы в Nature. Одни исследователи создали декодер, который переводил в текст беззвучную речь пациентки в текст со скоростью 62 слова в минуту, а вторая группа разработала немного другой интерфейс и перевела сигналы мозга не только в текст, но и в устную речь цифрового аватара и в его мимику. Их декодер генерировал текст со скоростью 78 слов в минуту. Предыдущий рекорд для подобных интерфейсов — 18 слов в минуту.