Google Translate предсказал Второе пришествие

Один из пользователей сервиса Google Translate обнаружил, что при переводе многократно написанного слова dog с языка новозеландских аборигенов маори на английский сервис выдает довольно членораздельное предсказание Второго пришествия Иисуса Христа. Об этом сообщает The Next Web.

Классический машинный перевод работает благодаря использованию множества параллельных корпусов (текстов на языке-источнике и языке-цели). Такой перевод еще называют «статистическим» машинным переводом, а в последнее время его также дополняют использованием глубокого обучения, которое позволяет учитывать контекст: к примеру, два года назад Google сделали максимально точный машинный перевод с использованием нейросети, а осенью прошлого года Яндекс представил свою «гибридную» версию переводчика.

Как достоинством, так и недостатком современных систем машинного перевода является то, что переводят они все: даже те слова, которых в языке нет. Разумеется, переводчик сообщает пользователю об ошибке исходного текста, предлагая ему выбрать другой язык; тем не менее, иногда такой перевод приводит к неожиданным результатам: как, например, в случае с монгольским, в переводе с которого множество «о» становится вполне осмысленным текстом.

Так же получилось и с языком маори, в котором нет слова «dog»: Google Translate, получив на вход несколько раз написанное слово, перевел его на английский целым предложением — предзнаменованием о Втором пришествии Иисуса Христа и Конце света:

Doomsday Clock is three minutes at twelve We are experiencing characters and a dramatic developments in the world, which indicate that we are increasingly approaching the end times and Jesus’ return.

Часы Судного дня показывают без трех минут полночь. Мы переживаем признаки и существенные изменения в мире, которые указывают на стремительное приближение конца времен и пришествие Иисуса.

По словам The Next Web, их источник в Google сообщил, что получившийся текст не имеет смысла и представляет собой всего лишь реакцию системы перевода на бессмысленный исходный фрагмент. Религиозный уклон получившегося перевода можно объяснить тем, что библейские тексты — все еще самый популярный и основной источник для создания параллельных корпусов, в особенности — редких. В прошлом году немецкие лингвисты даже собрали корпус, состоящий из более тысячи переводов Нового завета.

Елизавета Ивтушок

Нашли опечатку? Выделите фрагмент и нажмите Ctrl+Enter.
Треть импульса однодюймового удара Брюса Ли пришлась на движение тела

Разобраться в этом помогло видео с Чемпионата про каратэ