Физики из США разработали нейросеть, которая рассчитывает высоту пучка излучения синхротрона с точностью около 0,4 процента и при этом ограничивается мощностями обычного домашнего компьютера. Более того, нейросеть советует, как нужно скорректировать параметры установки, чтобы колебания высоты были минимальны. Используя этот алгоритм на реальном синхротроне ALS, ученые почти на порядок снизили амплитуду колебаний полученного пучка (от 1,5 до 0,2 микрометра). Статья опубликована в Physical Review Letters, кратко о ней сообщает Physics.
Когда заряженные релятивистские частицы движутся по круговым траекториям в постоянном магнитном поле, они испускают электромагнитное синхротронное излучение. Из-за релятивистских эффектов практически все испускаемое излучение лежит в узком конусе, ось которого направлена вдоль скорости частицы, а угол раствора обратно пропорционален гамма-фактору. Поэтому стороннему наблюдателю, который смотрит на траекторию частицы, кажется, будто частица испускает излучение узкими вспышками с фиксированной частотой (поскольку частица движется по кругу, она периодически проходит узкие участки траектории, в которых ее скорость направлена на наблюдателя). Кроме того, мощность и частота синхротронного излучения быстро растут с увеличением магнитного поля и скорости частицы. Например, синхротроны четвертого поколения испускают рентгеновское излучение (длина волны от 0,001 до 10 нанометров), яркость которого в сотни триллионов раз превышает яркость рентгеновской трубки.
Благодаря этим свойствам с помощью синхротронного излучения очень удобно исследовать строение вещества на масштабах нескольких нанометров. В частности, с помощью источников синхротронного излучения ученые восстанавливают строение сложных молекул (например, белков и нуклеиновых кислот) и в реальном времени следят за химическими реакциями (например, за разрядкой аккумулятора). Все практические приложения синхротронного излучения ограничены его стабильностью — стабильностью направления, в котором испускается пучок, ширины и высоты пучка, его интенсивности и длины волны. Чем слабее колеблются эти величины, тем выше разрешение картинки, которую можно получить с помощью синхротрона.
В современных синхротронах основным источником погрешности являются колебания высоты пучка, связанные с несовершенством ондуляторов и вигглеров. Шум, который эти колебания вносят в конечные данные, находится на уровне нескольких процентов от интенсивности сигнала и в десятки раз превышает шум от колебаний всех остальных величин, вместе взятых. Поскольку среднее время измерений на источнике синхротронного излучения редко превышает одну миллисекунду, этот шум нельзя убрать с помощью усреднения по большому числу повторяющихся измерений. Поэтому ученые пытаются предсказать возможные изменения высоты пучка и корректируют их, подстраивая орбиту заряженных частиц и оптику, сквозь которую проходит излучение.
Такие корректировки часто совмещают в себе механизмы прямой и обратной связи, оба из которых страдают от своих недостатков. С одной стороны, прямая связь полагается на физическую модель, которая предсказывает поле заданной установки. Поскольку поле каждой составляющей установки рассчитывается по отдельности, этот метод очень требователен к вычислительной мощности компьютера. Поэтому с помощью этого метода невозможно ухватить быстрые, но относительно слабые колебания, связанные с колебаниями температуры, дрожанием земли и приливными эффектами. С другой стороны, механизмы обратной связи учитывают такие мелкие изменения, но обычно работают только в узком диапазоне параметров, который лишь частично пересекается с реальным диапазоном.
Группа физиков под руководством Саймона Лимана (Simon Leemann) разработала алгоритм на основе нейронных сетей, который быстро рассчитывает магнитное поле установки с относительной погрешностью порядка 0,5 процента. С помощью этого алгоритма ученые скорректировали магнитное поле синхротрона ALS (Advanced Light Source). В результате ученым удалось на порядок снизить амплитуду колебаний высоты пучка.
В основе разработанного алгоритма лежала нейросеть с выпрямленной (rectified) линейной активационной функцией и тремя скрытыми слоями, содержащими 128, 64 и 32 нейрона соответственно. Нейросеть ученые обучали на массиве, содержащем данные как о магнитном поле, колебания которого изменяют траекторию заряженных частиц и косвенно сказываются на ширине пучка, так и о ширине пучка самой по себе. На синхротроне ALS эти данные можно собирать с частотой около 10 раз в секунду. Для обучения физики использовали метод обратного распространения ошибки. В результате обученная нейросеть предсказывала высоту пучка с погрешностью около 0,4 процента от полной высоты пучка. Кроме того, алгоритм успевал получить результат всего за несколько миллисекунд, хотя он был запущен на обычном домашнем компьютере. Это время в сотни раз меньше времени, за которое ученые собирают информацию с реального ускорителя, поэтому с помощью разработанного алгоритма вполне можно на лету корректировать работу синхротрона.
Поэтому исследователи доработали алгоритм и заставили его рассчитывать, как нужно скорректировать параметры установки, чтобы колебания высоты пучка были минимальны. После этого ученые подключили алгоритм к реальному синхротрону ALS. В результате физикам удалось снизить амплитуду колебаний пучка до погрешности предсказаний нейросети, то есть до 0,4 процента от полной высоты пучка (в пересчете на реальные данные это около 0,2 микрометров). Это почти на порядок превосходит амплитуду колебаний пучка, скорректированного с помощью традиционных алгоритмов (около 1,5 микрометров).
Учитывая успех разработанного алгоритма, в будущем ученые планируют полностью перевести синхротрон ALS на корректировку с помощью нейросети. По оценкам физиков, для компьютера, который в настоящее время корректирует параметры установки, это высвободит около ста часов машинного времени в год.
Сейчас машинное обучение проникло практически во все области науки, и физику этот способ решения задач тоже не обошел стороной. За последние несколько лет с помощью машинного обучения ученые научились исправлять ошибки квантовых компьютеров, решать квантовую задачу многих тел, рассчитывать химические свойства молекул, искать распады бозона Хиггса, выделять релевантные степени свободы физических систем, оценивать стабильность кристаллов, предсказывать рост кристаллов и искать высокотемпературные ферромагнетики. Скорее всего, в ближайшее время список физических задач, решенных с помощью машинного обучения, расширится еще больше.
Дмитрий Трунин