В российском издательстве «Individuum» вышла «Будущее без работы. Технологии, автоматизация и стоит ли их бояться» Дэниела Сасскинда — первая книга, официально переведенная на русский язык с помощью машинного перевода. За перевод отвечал Яндекс.Переводчик — издательство использовало алгоритм, который используется для перевода больших текстов. Перевод 350-страничной книги занял 40 секунд, а по качеству был сравним с переводом среднего качества, сделанным человеком-переводчиком, сообщается в пресс-релизе, поступившем в редакцию N + 1.
Несмотря на то, что машинный перевод (во многом — благодаря использованию нейросетей в дополнение к стандартному статистическому переводу или вместо него) в последние годы активно развивается и совершенствуется, до автономной работы в некоторых областях ему все же еще далеко. Это, например, касается книгоиздательства: исследователи считают, что несмотря на то, что машинные переводчики с использованием нейросетей стали только лучше, издатели книг вряд ли доверят им перевод в ближайшие несколько лет.
Разумеется, машинный перевод используют при переводе книг — но больше в помощь переводчику-человеку или неофициально (перевод, сделанный с помощью онлайн-переводчиков, считается некачественной работой). Тем не менее, книги с помощью машинного перевода адаптируют и официально: например, в 2018 году французская компания Quantmetry перевела 800-страничную книгу по машинному обучению на французский с помощью машинного перевода: весь процесс занял 12 часов (для сравнения, у переводчика-человека эта работа заняла бы несколько месяцев).
С книгой Сасскинда объемом в 350 страниц машинный перевод справился меньше чем за минуту: для этого использовался один из алгоритмов Яндекс.Переводчика на основе архитектуры Transformer: с его помощью переводят большие тексты — например, недоступные на русском страницы «Википедии».
Как и в случае со стандартным переводом, машинному переводу книги понадобилась редактура, но, по словам издателя «Individuum» Феликса Сандалова, это заняло столько же времени, сколько ушло бы на редактуру среднего по качеству перевода, сделанного человеком. «При этом на самом этапе перевода мы выиграли четыре-пять месяцев времени, что позволило нам выпустить последнее издание книги Сасскинда практически синхронно с европейским релизом», — отмечает Сандалов. Для оценки работы Яндекс.Переводчика в книге также есть несколько фрагментов, которые не подвергались редактуре.
Обложку для книги также создали с помощью нейросети (для основы взяли произведения современного искусства), а сама книга уже доступна в электронной и печатной версии.
На недавней конференции YaC 2020 Яндекс показал новую версию умной колонки Станция, а также рассказал об обновлениях технологий беспилотных автомобилей и поиска. Кратко об этом вы можете прочитать здесь.
Елизавета Ивтушок
Что такое опенсорс и почему он важен для IT-индустрии
Наверняка вам доводилось слышать выражение «опенсорс». Может быть, вы даже понимаете, что под этим термином скрывается «программное обеспечение с открытым исходным кодом». Но какие возможности такая открытость дает разработчикам и почему может быть выгодна обыкновенным пользователям? Рассказываем о разработке и значимости опенсорс-проектов.