Физики из США и Швейцарии научили нейросеть считать функциональные интегралы и проверили ее работу на 1+1-мерной модели Тирринга. Таким образом им удалось добиться ускорения расчетов почти на порядок по сравнению со стандартными методами. Препринт работы опубликован на сайте arXiv.org.
Функциональный интеграл был популяризован Ричардом Фейнманом в 40-х годах прошлого века. Грубо говоря, для вычисления интеграла от некоторого функционала нужно просуммировать значения этого функционала на всех возможных траекториях. Например, это можно сделать, переходя к решеточному приближению, сводя функциональный интеграл к обычному N-кратному и вычисляя предел при N, стремящемся к бесконечности. Математически корректное определение фейнмановского интеграла до сих пор не было дано, и в некоторых случаях разные приближения приводят к разным результатам. Тем не менее, формализм функционального интеграла активно используется в квантовой теории поля, например, для вычисления корреляторов (функций Грина) и сечений рассеяния при столкновениях частиц.
К сожалению, во многих системах, представляющих большой интерес (например, модель Хаббарда), возникают такие интегралы по траекториям, в которых подынтегральное выражение быстро колеблется, что сильно мешает их прямому вычислению. Эта ситуация называется «проблемой знака» (sign problem). Существуют разные способы обойти проблему. Например, в последнее время приобрел популярность наперсточный подход (thimble approach). Его суть заключается в том, чтобы свести интеграл от действительных полей к интегралу на некотором многообразии, вложенном в пространство комплексных полей, так чтобы значение интеграла не изменялось, а вычисления упрощались. Наперстками называются циклы, по которым в результате производится интегрирование в комплексном пространстве.
В своей работе физики разработали следующий подход к вычислению функциональных интегралов. Сначала они построили некое вспомогательное многообразие (Learnifold), на котором проще производить вычисления, но которое в то же время хорошо приближает исходное многообразие. Хорошо в том смысле, что значения функциональных интегралов совпадают в обоих случаях. Затем ученые сгенерировали обучающую выборку с помощью потокового алгоритма (flow-based algorythm), и тренировали на ней нейросеть, заставляя ее минимизировать расстояние между рассчитанными и известными значениями. Всего в сети было три уровня и десять узлов, а все связи были направлены строго от входных нейронов к выходным (сеть прямого распространения). Наконец, прогоняя через обученную сеть нужные данные и используя алгоритм Метрополиса-Гастингса, физики находили значения эффективного действия и определенных корреляторов.
Обучение и работу нейросети ученые проводили для 1+1-мерной модели Тирринга. В этой модели возникает «проблема знака», но ее можно избежать, конструируя вспомогательное многообразие специальным образом. Чтобы проверить работу нового метода, физики повторили результаты другой своей статьи и вычислили определенный коррелятор (average sign) и значения фермионной плотности на сетках размером 10 на 10, 20 на 10 и 40 на 10. Обезразмеривание производилось домножением массы на характерный параметр длины решетки. В целом результаты, полученные в старой и новой статье, совпали, это можно увидеть на графиках.
Также физики сравнили скорость вычислений на сетке 20 на 10 с помощью нейросети и метода, который они использовали в более ранней работе. Всего на расчеты с нейросетью ушло 254 часа машинного времени: 90 на создание обучающей выборки, 24 на обучение и 140 на собственно расчеты. Те же самые расчеты, выполненные напрямую, по словам авторов, заняли бы 4100 часов машинного времени. Таким образом, ученые получили выигрыш во времени больше, чем на порядок.
Нейросети все более активно используются в различных сферах жизни. Например, мы писали о сетях, которые сочиняют песни и пишут книги. Также совсем недавно ученые разработали нейросеть, определяющую сексуальную ориентацию человека по его фотографии.
Дмитрий Трунин
Обычно рентгеноструктурный анализ требует сотен тысяч атомов
Химики из США, Китая и Франции использовали синхротронное излучение для характеризации отдельных ионов железа и тербия в составе комплексных соединений, нанесенных на поверхность золота. Ученые смогли детектировать электронные переходы этих атомов только тогда, когда тонкий металлический детектор располагался точно над атомами металлов. Исследование опубликовано в журнале Nature. Синхротронное излучение позволяет проводить рентгеноструктурные исследования на очень небольших образцах вещества, содержащих около 104 атомов. Но если для регистрации фотоэлектронов использовать очень тонкий металлический детектор, разрешение можно повысить еще сильнее — до всего нескольких десятков атомов в образце. Тем не менее детектировать сигналы от одиночных атомов ученые не умели до сих пор. Но недавно физики и химики под руководством Фолькера Розе (Volker Rose) использовали синхротрон APS в Аргоннской национальной лаборатории для проведения рентгеновского анализа отдельных атомов. Для этого ученые приготовили комплексы железа и тербия с замещенными пиридиновыми лигандами на поверхности золота. Первый эксперимент с синхротронным излучением ученые провели на поверхности с комплексами железа. Они разместили детектор на большом расстоянии (пять нанометров) от образца, при котором невозможно туннелирование фотоэлектронов между поверхностью и детектором. В полученной зависимости энергии фотоэлектронов от тока в детекторе химики наблюдали сигналы от электронных переходов всех ионов железа, расположенных вблизи детектора. В следующем эксперименте физики расположили детектор намного ближе к образцу — так, чтобы фотоэлектроны могли туннелировать. Во время эксперимента ученые обнаружили, что при движении детектора сигналы переходов меняются. Причем сигналы, соответствующие электронным переходам иона железа, появлялись только тогда, когда детектор располагался точно над ионом железа. Тот же самый эксперимент удалось провести и с комплексом тербия. И, как и в случае комплексов железа, сигналы от электронных переходов тербия возникали только при точном расположении детектора над его катионами. Далее ученые решили применить синхротронное излучение для анализа электронной структуры комплексов. Для этого они использовали спектроскопию рентгеновского поглощения в ближней к краю области и проанализировали тонкую структуру полученных сигналов. В результате оказалось, что железо в комплексе имело степень окисления +2, а тербий — +3. Кроме того, удалось выяснить, что 3d-орбитали иона железа взаимодействуют с лигандами, а 4f-орбитали тербия — нет. Так ученые показали, что синхротронное излучение и правильно спроектированный детектор позволяют проводить рентгеноструктурные исследования на отдельных атомах. При этом можно узнать не только то, где они расположены, но и выяснить детали их электронной структуры. Недавно мы рассказывали о том, как сибирские ученые создали клистрон для Сибирского кольцевого источника фотонов (СКИФ). А прочитать подробнее про историю рентгеноструктурного анализа можно в нашем материале «Деплатформинг структур».