В архив уместились все протон-протонные столкновения, произошедшие в первом сезоне
Физики из коллаборации CMS опубликовали внушительный объем данных, собранный их детектором в ходе первого сезона работы Большого адронного коллайдера. Он состоит из 491 терабайта, разбитого на 42 датасета, и содержит результаты протон-протонных столкновений, а также руководство и исходный код алгоритмов. Ознакомиться со всем содержимым можно на сайте ЦЕРН.
Большой адронный коллайдер, расположенный в Европейском Центре ядерных исследований (ЦЕРН), известен тем, что в результате его работы образуется колоссальный объем данных. Их собирают несколько детекторов БАКа, самые крупные из которых — это четверка ALICE, ATLAS, CMS и LHCb (о них мы регулярно пишем с тегом «Коллайдер»).
Важное условие, которое было заложено при создании ЦЕРН — это открытость собираемых данных и научных результатов, полученных на их основе. Это выражается в требовании к научным статьям всех коллабораций БАКа иметь статус «open access», а также регулярной публикации архива с собранными данными, которую ЦЕРН проводит с 2014 года.
Недавно мы рассказывали о том, что физики работающие с детектором LHCb, поделились со всеми желающими архивом данных объемом 200 терабайт. Опубликованные датасеты содержат пятую часть информации о протон-протонных столкновениях, произошедших в детекторе в течение первого сезона работы БАКа. Теперь аналогичным массивом данных поделилась коллаборация CMS.
Суммарный объем информации, содержащийся в 42 новых датасетах, равен 491 терабайту. Он включается в себя все, что было собрано детектором CMS в 2012 году за первый сезон работы коллайдера. Часть этих данных были использованы для обнаружения бозона Хиггса, что принесло Нобелевскую премию Франсуа Энглеру и Питеру Хиггсу в 2013 году.
Как и их коллеги из LHCb, физики из CMS опубликовали также подробные руководства по интерпретации данных, а также исходный код программ, который помогает это делать. Сейчас ученые готовят к публикации следующие наборы данных, которые включат в себя результаты экспериментов с тяжелыми ионами в ходе первого сезона, а также результаты протон-протонных столкновений, произошедших во втором сезоне.
Это всего 20 процентов информации, собранной коллаборацией
Физики, работающие с детектором LHCb, поделились со всеми желающими архивом собранных данных объемом 200 терабайт. Опубликованный массив данных предназначен в первую очередь для ученых, занимающихся физиков элементарных частиц, однако специалистам по Data Science и машинному обучению он также может быть полезен.