Физики из Массачусетского технологического института, Университета Шербрука и компании Elenion разработали фотонную микросхему, предназначенную для алгоритмов глубокого обучения. По словам авторов, фотонные вычислители способны решать некоторые задачи гораздо быстрее, чем их электронные аналоги — например, это касается умножения матриц. Эти задачи часто возникают при глубоком обучении нейросетей и представляют наибольшую вычислительную сложность. Ученые протестировали работу нейросети, обучив ее распознавать гласные звуки. Исследование опубликовано в журнале Nature Photonics, кратко о нем сообщает пресс-релиз MIT.
Нейронные сети — один из наиболее быстро развивающихся методов обработки информации. Они представляют собой сложные конструкции, немного напоминающие реальные биологические системы из нейронов, которые получают на входе информацию и преобразуют ее некоторым способом. Например, на вход в нейросеть может поступать изображение буквы, а на выходе — сама буква. Важная задача — обучение нейросети. В случае обучения с учителем, оно состоит в следующем: компьютеру предъявляют очень большое количество пар объект-ответ, а искусственные нейроны сети корректируют свои параметры, чтобы после прохождения объекта через нейросеть информация на выходе была максимально близка к правильному ответу.
Глубокое обучение — один из методов обучения нейросетей, он предполагает, что сеть состоит из нескольких слоев (их могут быть десятки). Считается, что именно глубокое обучение позволяет находить закономерности с высоким уровнем абстракции. Одна из проблем глубокого обучения — высокая вычислительная сложность для классических компьютеров. Работа его алгоритмов требует многократного последовательного перемножения матриц. Подробнее о машинном обучении можно прочесть в материале азбуки ИИ: «Машинное обучение».
Авторы новой работы разработали фотонный чип, который использует альтернативный подход к вычислениям, сопряженным с глубоким обучением. Вместо традиционной транзисторной логики, основанной на электронах, физики предложили использовать фотонную логику. Некоторые преобразования света — например, его фокусирование линзой, можно рассматривать как вычисления. Так, создание изображения в фокальной плоскости обычной линзы очков — продукт фурье-преобразования светового поля, происходящего, по сути, со скоростью света.
Фотонный чип представляет собой сеть из взаимосвязанных волноводов, причем эти связи могут программируемо изменяться. По словам авторов, с помощью такой системы можно реализовать практически любые матричные операции. Более того, для их выполнения требуется гораздо меньше энергии и времени, чем в обычных компьютерах. Финальная версия устройства будет состоять из большого количества слоев.
На данном этапе работы ученые реализовали на фотонном чипе распознавание гласных звуков. Систему натренировали на распознавание четырех различных гласных. Пока она дает верный ответ в 77 процентах случаев, по сравнению с 90 процентами для традиционных компьютеров. Как отмечают авторы, нет никаких ограничений для того, чтобы масштабировать систему и увеличить ее точность.
Помимо распознавания, фотонные нейронные сети можно использовать и для обработки и преобразования аналоговых сигналов в режиме реального времени. К примеру, оптические сигналы не нужно будет преобразовывать в цифровые для обработки, и, затем, снова преобразовывать в оптические.
Глубокое обучение позволяет решать огромный спектр задач. Так, с его помощью можно декодировать образы букв в голове человека, перерисовывать картины в разных художественных стилях, учить компьютеры читать «Гарри Поттера». Также существуют методы прогнозирования, основанные на нейросетях — с их помощью ученые научились бороться с декогеренцией кубитов, битов квантовых компьютеров.