Кратко объясняем ключевые термины из области ИИ
Любую технологию, связанную с искусственным интеллектом, сегодня принято называть нейросетью. На самом деле это далеко не всегда корректно: например, GPT-4 — языковая модель на базе нейросети. Вместе с научно-исследовательским Институтом искусственного интеллекта AIRI мы подготовили материал, который поможет разобраться в том, какие технологии сегодня используют разработчики систем искусственного интеллекта, и на базовом уровне понять, как устроены последние достижения в этой области.
Так называют область компьютерных наук или информатики, которая занимается созданием интеллектуальных систем, способных выполнять задачи, обычно требующие интеллектуальных усилий человека. ИИ использует Алгоритм — набор инструкций, который может быть выполнен компьютером или другим устройством. Модель — упрощенное представление реальной системы или явления, которое позволяет анализировать и предсказывать ее поведение.
Иногда под искусственным интеллектом (Artificial Intelligence, AI) ошибочно понимают сильный искусственный интеллект (Artificial General Intelligence, AGI) — систему, которая может «думать и действовать» как человек. На самом деле большинство современных разработок в этой сфере предназначены для выполнения конкретных задач, и многие называют их слабым искусственным интеллектом (Narrow AI) или технологиями искусственного интеллекта (AI Technologies). Например, программа для игры в шахматы не умеет отвечать на вопросы, а чат-бот, имитирующий живого собеседника, — рисовать изображения. Тем не менее постепенно искусственный интеллект становится все более функциональным. Например, языковая модель GPT-4, хотя все еще не может генерировать ничего, кроме текста, умеет обрабатывать не только текстовые запросы, но и изображения.
На сегодняшний день можно выделить три основные области искусственного интеллекта и три сопутствующие им задачи.
Машинное обучение (Machine Learning), глубокое, или глубинное, обучение (Deep Learning) и базисные модели (Foundation Models) — это области в разработке ИИ, которые позволяют системе самостоятельно учиться на основе больших объемов данных и опыта.
Глубокое обучение — это подраздел машинного обучения, использующий сложные нейронные сети для решения самых нетривиальных задач, например распознавания речи и обработки естественного языка. Фундаментальное отличие глубокого обучения от машинного заключается в том, что для машинного обучения измеримые свойства данных (признаки), на которые ИИ должен обратить внимание, задает человек, тогда как глубокое обучение находит их самостоятельно.
Нейронные сети — на данный момент, вероятно, основной инструмент в сфере искусственного интеллекта. Как и человеческий мозг, нейронные сети состоят из узлов (нейронов), которые обрабатывают информацию и обмениваются ею друг с другом. В зависимости от задачи разработчики применяют различные архитектуры нейронных сетей.
Например, сверточные нейронные сети (Convolutional Neural Networks, CNN) широко используются для обработки изображений и видео. Это особый класс многослойных нейросетей, способных извлекать из изображений характерные признаки, уменьшать эти данные в размере (это и называется сверткой) и благодаря этому эффективно распознавать объекты и обрабатывать большие объемы данных. Такие нейросети могут, например, находить на видео целующихся людей и помогать ученым восстанавливать позы животных.
Модели машинного обучения (от англ. machine learning model) — это методы, позволяющие компьютерам обучаться на большом количестве данных и благодаря этому делать прогнозы или принимать решения. ML-модели можно использовать, например, для сортировки результатов веб-поиска, прогнозирования цен на недвижимость или определения настроения текста. Для решения более сложных задач, таких как обработка изображений или распознавание речи, они используются в сочетании с нейронными сетями. Модели машинного обучения — важный инструмент для создания систем искусственного интеллекта, которые в том числе применяются в науке (об этом ниже).
Базисные модели — это модели машинного обучения, которые используются для решения простых задач, таких как классификация и регрессия. Они могут быть использованы в комбинации с более сложными моделями для улучшения их точности и эффективности.
Генеративные модели (от англ. generative model) — методы искусственного интеллекта, которые используются для создания новых данных (изображений, музыки, текста и прочих) на основе обучающего датасета, состоящего из большого количества данных. Примером больших данных для генеративных моделей могут быть наборы изображений, такие как CIFAR-10, состоящий из 60 000 цветных изображений размером 32×32 пикселя, или ImageNet, который содержит более 1,2 миллиона изображений, разбитых на более чем 1000 категорий.
Генеративно-состязательные сети (от англ. generative adversarial network, GAN) — это разновидность генеративной сети, которая состоит из двух нейронных сетей: генератора, создающего новые данные, например изображения, и дискриминатора, который пытается отличить их от объектов из обучающей выборки. Задача GAN — генерировать такие данные, которые дискриминатор не сумеет опознать как искусственные. Таким образом генеративно-состязательные сети позволяют добиться фотореалистичного результата — например, создавать качественные изображения лиц несуществующих людей.
Трансформерные архитектуры (от англ. transformer architecture)— наиболее сильный тип нейронных сетей на сегодняшний день. Он позволяет более эффективно обрабатывать последовательности данных, таких как текст или речь, за счет параллельных вычислений — в отличие от последовательной обработки в устаревших Разновидность нейронных сетей, где связи между элементами образуют направленную последовательность.
Глубокое, или глубинное, обучение (от англ. deep learning) — это подход к машинному обучению, использующий многократное применение нейронных сетей с большим количеством слоев для решения сложных задач, таких как распознавание речи или обработка изображений.
Говори как разработчик
Не нужно обладать особыми знаниями, чтобы увидеть, как технологии искусственного интеллекта меняют мир. Генеративные нейросети уже помогают дизайнерам (подробнее об этом читайте в материале «Совместный сновидческий процесс»), с помощью языковых моделей, например GPT-4, редактируют тексты и даже создают несложные приложения, а компьютерное зрение и другие алгоритмы обеспечивают движение беспилотных автомобилей. Тем не менее технологии искусственного интеллекта нуждаются в совершенствовании. Этим занимаются не только разработчики, но и исследователи, которые решают проблемы, возникающие на этапах разработки или внедрения технологии.
Например, в большинстве беспилотных автомобилей для оценки расстояния до объектов на дороге используют дорогостоящие датчики — лидары. Их высокая стоимость замедляет внедрение технологии в повседневную жизнь, поэтому компании ищут альтернативные подходы к созданию Изображение, содержащее информацию о расстоянии до окружающих объектов.
Технологии искусственного интеллекта активно применяются не только в прикладных целях, но и в фундаментальной науке. В частности, машинное обучение хорошо справляется с задачами моделирования в материаловедении, где его используют, чтобы искать новые материалы с необходимыми свойствами. В прошлом году исследователи AIRI представили нейросетевую модель, которая позволяет находить структуры, близкие к квазикристаллам — промежуточному звену между кристаллами и аморфными веществами, которое, благодаря необычной структуре, обладает уникальными свойствами.
Кроме того, начиная с 1970-х годов исследователи пытались найти способ использовать алгоритмы, чтобы предсказывать структуру белков. По форме белка можно определить его функцию и использовать это знание, например, для создания лекарств. Однако успеха в этой области добились относительно недавно. В 2020 году компания DeepMind представила алгоритм AlphaFold 2, предсказывающий структуры белков по последовательности аминокислот. Появление такого алгоритма — важная ступень в развитии структурной биоинформатики, которая поможет не только в биологии, но и в медицине, ускорив разработку новых лекарств.
Машинное обучение позволяет выполнять и обратную задачу: используя информацию о том, какой должна быть форма белка с необходимой функцией, определить аминокислотный состав для его синтеза. Например, обученная на 280 миллионах белковых последовательностях языковая модель ProGen, статья с описанием которой опубликована в Nature Biotechnology, способна генерировать белки de novo, не существовавшие ранее и обладающие нужными характеристиками.
Еще одна важная задача в биологии — работа с последовательностями ДНК. И если ученым уже вполне доступны языковые модели для последовательностей белков, то для ДНК долгое время в открытом доступе существовала только одна такая разработка, принадлежащая коллективу из США, — модель DNABERT. Исследователи AIRI использовали методы обработки естественного языка, чтобы разработать нейросетевую модель GENA_LM, обученную на самой полной на сегодняшний день сборке генома человека — T2T-CHM13. Проверяя эффективность модели для разных геномных задач, они поняли, что иногда для достижения наилучших результатов требуется увеличивать размер То есть данных, используемых для обучения модели. То есть элементарных составляющих элементов ДНК и РНК.
Ученые могут использовать данные модели для решения различных исследовательских задач: от поиска участков генома, выполняющих регуляторные функции в процессах считывания РНК, до определения влияния отдельных мутаций на интенсивность работы генов. И в зависимости от поставленной задачи и доступных данных модели на разных архитектурах могут показывать разную эффективность.
Герои «Объяснялкиных» комментируют новости N + 1
Научные новости не обязательно вселяют уверенность в будущем, а ответы на вопросы о том, как устроен мир, могут не понравиться вообще никому. Проще говоря, есть вещи, о которых лучше не задумываться. К счастью, сделать это за вас могут другие! По нашей просьбе герои анимационного сериала «Объяснялкины» — обыкновенная семья, запертая внутри собственного научно-популярного шоу и вынужденная говорить на самые разные темы — изучили новости, которые недавно появились на N + 1, и прокомментировали наиболее интересные.