Сбербанк 10 ноября проводит ежегодный Sberbank Data Science Day — форум, посвященный машинному обучению, анализу данных и исследованиям в области искусственного интеллекта. В рамках конференции пройдут более 20 секций и выступят более 60 разработчиков, в том числе исследователь Су-Ян Ли из Корейского института передовых технологий (KAIST), а также представители компаний-лидеров в области DS/AI — DeepMind, H2O и других. Кроме того, будут подведены итоги конкурса для разработчиков Sberbank Data Science Contest с призовым фондом 3 миллиона рублей.
Sberbank Data Science Day проводится ежегодно с 2016 года: Сбербанк собирает российских и зарубежных экспертов в области современных технологий, а также устраивает лекции и семинары, касающиеся самых востребованных тем в области искусственного интеллекта и машинного обучения. В этом году помимо выступления ключевых спикеров на конференции пройдут панельные дискуссии «Технологии анализа данных и искусственного интеллекта в Цифровой Экономике» и «Тренд на инновации: применение DS/AI и улучшение клиентского опыта». В тематических блоках Business Stage, Science Stage и Community Stage разработчики проведут небольшие сессии по темам, касающимся как машинного обучения, так и применения современных технологий в экономике, бизнесе и науке.
Во время мероприятия будут подведены итоги Sberbank Data Science Contest, участники которого должны были разработать алгоритм, который самостоятельно проводит весь цикл построения модели машинного обучения. Призовой фонд конкурса составил 3 миллиона рублей.
Прямая трансляция конференции, а также подробная информация о спикерах и темах выступлений доступна по ссылке.
Она поможет написать письмо, план тренировки или сочинит историю
Яндекс обучил большую русскоязычную языковую модель YandexGPT и внедрил ее в своего виртуального помощника Алису. Сейчас нейросеть тестируют пользователи продуктов Яндекса, новость об этом вышла на сайте компании. Языковая модель — это нейросеть, которая умеет генерировать тексты, по очереди предсказывая каждое слово в предложении. Языковая модель YandexGPT основана на архитектуре Transformer, которую создали исследователи из Google в 2017 году. Когда в такую нейросеть загружают текст, она умеет выделять в нем важные слова и фокусировать на них внимание. Главный навык модели — хорошо понимать и запоминать тексты, и генерировать новые. Когда нейросеть осваивает этот навык, она одновременно естественным образом учится выполнять самые разные задачи, связанные с анализом текстов. Большие языковые модели основаны на архитектуре Transformer и обучены на огромном количестве данных, обычно из интернета. Они умеют создавать текст, почти не отличимый от человеческой речи. Первой успешной моделью такого типа стала нейросеть GPT от компании OpenAI. В 2022 вышла улучшенная версия модели ChatGPT. Ее не просто натренировали на большом количестве данных, но и дообучили с помощью обучения с подкреплением. Люди-эксперты работали с нейросетью в режиме диалога, показывая ей как правильно отвечать на вопросы. В надежде повторить успех ChatGPT, многие компании обучают свои языковые модели-аналоги (например, Bard от Google или Poe от Quora). Яндекс первым внедрил такую модель в виртуального помощника. 17 мая Яндекс выпустил большую языковую модель YandexGPT в открытый доступ. С ней можно пообщаться через Алису в приложении Яндекс, браузере, умной колонке или телевизоре. Чтобы активировать YandexGPT, нужно сказать: «Алиса, давай придумаем!» Языковая модель пока находится в режиме тестирования, но уже умеет выполнять разные задачи пользователей: выбрать подарок, составить план тренировки или написать деловое письмо. Модель умеет составлять грамотные содержательные тексты, но может ошибаться в фактах. Посмотрите, как пользователи общаются с YandexGPT: Нейросеть обучали на суперкомпьютерах Яндекса в два этапа. Сначала разработчики отобрали для обучения много книг, статей и страниц сайтов с помощью поисковых инструментов Яндекса — по утверждению компании, в выборку попадали только содержательные и хорошо написанные тексты. На втором этапе модель дообучили, чтобы она лучше вела диалог. Для этого Яндекс воспользовался методом, который придумали исследователи из OpenAI. Эксперты-разметчики составили сотни тысяч пар вопрос-ответ и показывали их YandexGPT на втором этапе обучения. Но у YandexGPT есть свои ограничения. Например, нейросеть пока не умеет запоминать контекст и учитывать предыдущие реплики. Однако YandexGPT постоянно дообучается на новых данных от пользователей и может развить этот навык в будущем. Cравнить качество ответов YandexGPT с другими языковыми моделями пока невозможно, Яндекс не раскрыл эти данные. Также неизвестна точная архитектура модели и параметры ее обучения. Тем временем другая языковая модель GPT-4 научилась работать не только с текстом, но и с картинками.