Американские физики применили идеи машинного обучения для поиска среди экспериментальных данных распадов бозона Хиггса. Для этого они свели задачу к минимизации энергии в спиновой модели Изинга и построили сильный классификатор, который оказался устойчив к переобучению. Минимум ученые искали с помощью алгоритма имитации отжига и квантового отжига (в последнем случае расчеты выполнялись на компьютере D-Wave). Статья опубликована в Nature.
Для исследования свойств недавно открытого на LHC бозона Хиггса необходимо отбирать с высокой точностью события, отвечающие образованию и распаду бозона. Задача осложняется тем, что эти события происходят относительно редко, и приходится обрабатывать большие массивы экспериментальных данных. Методы машинного обучения могут сильно упростить эту задачу.
В данной работе физики исследовали распад хиггсовского бозона на два фотона, описываемый следующими диаграммами Фейнмана (на рисунке ниже). Процесс определяется импульсами бозона и фотонов, углом между исходным и конечным пучками и углом разлета фотонов. Однако на опыте померить эти параметры трудно, поэтому физики сконструировали из них восемь кинематических переменных, которые можно измерить непосредственно. Потом ученые собрали из этих величин тридцать шесть произведений, которые использовали в качестве параметров для обучения слабого классификатора.
Чтобы разработать более сильный классификатор, физики адаптировали для своей задачи модель Изинга. Набору из используемых для обучения переменных они сопоставили вектор в тридцатишестимерном пространстве, а принадлежности событию распада бозона — псевдоспин (равный единице, если распад зафиксирован, и минус единице в противном случае). Затем физики записали стандартное выражение для энергии в модели Изинга. Минимизируя эту энергию, можно найти некоторую конфигурацию спинов, которую затем можно использовать для построения классификатора событий распада. Также для предотвращения переобучения ученые ввели в модель параметр лямбда.
Конфигурацию спинов, минимизирующую энергию и используемую сильным классификатором, ученые искали с помощью алгоритма имитации отжига и квантового отжига. Во втором случае вычисления проводились на компьютере D-Wave, оперирующем 1098 кубитами. Также исследователи сравнили работу алгоритмов с работой сети глубокого обучения (deep mind network, DMN) и ансамблем усиленных деревьев решений (ensemble of boosted decision trees) с использованием алгоритма усиления XGBoost (XGB).
Для данных четырех алгоритмов физики построили кривые ошибок для обучающей выборки из 100 и 20000 событий. На графиках можно заметить, что алгоритмы отжига отличаются от DMN и XGB, превосходя их на небольших выборках и немного проигрывая на больших. Ученые отмечают, что в данной работе квантовый отжиг затруднился найти истинный минимум энергии, хотя и смог выявить события распада бозона. Это может быть следствием того, что текущее поколение компьютеров D-Wave страдает от погрешностей при вычислении гамильтониана, которыми нельзя пренебречь.
Также проверив работу классификатора для различных значений параметра лямбда, физики выявили три динамические переменные, которые вносят наибольший вклад в отбор процессов. Физическая причина важности для классификатора именно этих переменных заключается в массивности бозона Хиггса. Из-за этого факта образование фотонов с большим поперечным импульсом оказывается затруднено, что позволяет относительно надежно отличить события с участием бозона от фоновых процессов.
Ранее мы писали о том, как машинное обучение помогло физикам-теоретикам считать функциональные интегралы.
Дмитрий Трунин
Это поможет добывать руду и обрабатывать ядерные отходы
Европейские физики теоретически и экспериментально исследовали цикличные процессы всплытия и опускания на дно зерен арахиса в пиве, который называют «танец арахиса». Для этого они в течение двух с половиной часов снимали на камеру этот процесс в лаборатории. Анализируя эти результаты, ученые выяснили, что танец происходит из-за поверхностных свойств арахиса, на которых образование пузырьков предпочтительнее, чем на стенках стакана. Исследование опубликовано в Royal Society Open Science. В России распространен фокус, который показывают на вечеринках с шампанским. Для этого в полный бокал игристого напитка бросают изюминку, кусочек ананаса или дольку шоколада. Брошенное в жидкость тело сначала тонет, но затем всплывает под действием пузырьков газа, зародившихся на его краях. У поверхности пузырьки разрушаются и цикл повторяется. В аргентинских барах существует такая же традиция, только вместо шампанского там используют пиво, а вместо изюма — арахис. Там этот трюк получил название «танец арахиса». Несмотря на качественное понимание такого танца, физики плохо понимают его детали. Вместе с тем, такие процессы происходят не только на вечеринках или в барах, но и в природе: предполагается, что именно так плотный магнетит всплывает в магме. Похожим же образом горняки отделяют железо от руды. Разобраться в этом вопросе решили Луис Перейра (Luiz Pereira) из Университета Людвига Максимилиана и его коллеги из Англии, Германии и Франции. Для этого они провели экспериментальны с арахисом в пиве и подтвердили их результаты численными вычислениями. Физики наполняли резервуар размером 100 × 100 × 200 миллиметров одним литром лагера и опускали в него 13 обжаренных зерен арахиса Arachis hypogaea. Весь процесс они снимали на цифровую камеру. На начальном этапе все зерна плавали на поверхности из-за активного образования пузырей в перенасыщенном углекислом газом пиве. Примерно через 25-30 минут количество пузырьков уменьшалось и арахис начинал цикличное движение вверх и вниз под действием описанного выше механизма. Танец всех зерен прекратился примерно через 150 минут после начала эксперимента — количество газа, растворенного в пиве, опустилось ниже пороговой отметки. Для анализа результатов эксперимента авторы разбили задачу на три части: зарождение пузырьков, плавучесть и цикличность. Для этого им потребовалось знать капиллярные свойства системы, такие как плотность пива и газа, поверхностное натяжение, углы смачивания и так далее. Первое они рассчитали с помощью пивного онлайн калькулятора, второй — взяли из литературы, а для получения информации об углах ученым потребовалось провести дополнительные эксперименты по смачиванию пива стеклом и плоской частью арахиса. В результате физики смогли воспроизвести основные особенности поведения арахиса в пиве, которые они увидели в эксперименте. Так, они доказали, что арахис обладает поверхностью, на которой образование пузырей энергетически более выгодно, чем на стенках стакана. Если бы это было не так, танец арахиса был бы невозможен. Ученые отмечают, что арахис в пиве может служить модельной системой не только для задач геологии и добычи полезных ископаемых, но и в обработке ядерных отходов. Один литр пива — это не так много, когда речь идет о физическом эксперименте (впрочем, не только). То ли дело 30 литров! Именно столько потратили физики из Германии и Кореи, изучая стабильностью пивной пены при розливе «снизу-вверх».