Лаборатория Google Research запустила два новых сервиса, первый из которых — Talk to Books, — позволяет пользователям получать ответы от книг, а второй — Semantris, — играть в игры на поиск семантически связанных слов. С помощью этих сервисов Google демонстрирует способности своей системы искусственного интеллекта, занимающейся обработкой естественного языка, сообщает Engadget.
Одна из важных задач в области обучения речи компьютерных систем и работе поисковых сервисов — это эффективный автоматический поиск семантически связанных друг с другом слов. В рамках теоретической лингвистики этим занимается дистрибутивная семантика, а самый используемый инструмент — построение векторных моделей: в них слова представлены в виде многомерных векторов, близость между которыми указывает на семантическую близость слов.
Подобные задачи требуют большого количества данных для обучения, но показывают хорошие результаты. Новый сервис Google, Talk to Books, например, обрабатывает запросы пользователя (это может быть как вопрос, так и утвердительное выражение) и находит на него ответ в доступных на сервисе Google Books книгах: примерно так же при получении запроса действуют голосовые помощники.
Semantris — это простая, похожая на тетрис игра, с помощью которой пользователи могут оценить, насколько хорошо ИИ Google может распознавать смысл отдельных слов и находить семантически похожие. Игра показывает пользователю слово и предлагает ему ввести первое, что пришло в голову. Хотя информации об этом нет, Semantris, скорее всего, могут использовать и для дальнейшего обучения векторных моделей: примерно также компания поступила, когда запустила игру Quick, Draw!
Методы автоматической обработки естественного языка также используются в качестве инструмента количественных социологических исследований. Например, векторное представление слов на материале текстов, написанных в разные временные периоды, можно использовать для анализа изменений стереотипов в обществе. О том, как такие методы применяются в гуманитарных науках, вы можете прочитать в нашем интервью с доцентом Школы лингвистики НИУ ВШЭ Борисом Ореховым.
Елизавета Ивтушок
Опознайте археологическую находку по описанию нейросети
Представьте, что вы оказались на сайте, где торгуют древней посудой, инструментами, украшениями и другими ценностями. Захотелось что-нибудь прикупить? Тогда придется доказать, что вы разбираетесь в артефактах прошлого. Мы попросили генеративную нейросеть YandexGPT рассказать про археологические находки так, как если бы их можно было купить на маркетплейсе. Изучите описание и попробуйте догадаться, о чем идет речь.