Машинное обучение помогло химикам определить механизмы каталитических реакций

Большинство механизмов модель предсказала правильно

Химики из Великобритании разработали алгоритм глубокого обучения, способный предсказывать механизмы реакций по кинетическим данным. Ученые обучили свою модель на нескольких тысячах наборах кинетических данных, сгенерированных автоматически, а затем использовали для анализа шести изученных каталитических реакций. Исследование опубликовано в Nature.

Анализ кинетических данных позволяет изучать механизмы каталитических реакций. Обычно для подобного анализа химики проводят каталитическую реакцию с разными загрузками катализатора и измеряют концентрацию продукта или реагента в разные моменты времени. Затем, чтобы сделать выводы из этих зависимостей, необходимо рассчитать теоретические зависимости для нескольких предполагаемых механизмов, а затем сравнить полученные зависимости с экспериментальными. Если зависимости совпадают — значит механизм найден.

Еще один способ изучить механизм реакции — измерить начальные скорости реакции при разных начальных концентрациях реагента или катализатора. Далее можно построить логарифмическую зависимость начальной скорости от начальной концентрации, а из нее определить порядок реакции по реагенту или катализатору. Это тоже помогает делать предположения о механизме реакции.

Эти и другие более современные методы работают хорошо и ими часто пользуются. Но если механизм реакции сложный, достоверно интерпретировать полученные кинетические данные бывает очень трудно. Это происходит, например, если на нескольких каталитических стадиях катализатор дезактивируется. В этом случае нужно провести много кинетических экспериментов, и все равно гарантированно выбрать один подходящий механизм может не получиться.

Чтобы преодолеть эти проблемы, Игорь Ларроса (Igor Larrosa) и Jordi Burés (Хорди Бурес) решили разработать алгоритм машинного обучения, способный предсказывать механизмы каталитических реакций по кинетическим данным. Для этого они выбрали 20 распространенных механизмов каталитических реакций и с помощью численного решения соответствующих дифференциальных уравнений сгенерировали датасет из пяти миллионов наборов кинетических данных, нужных для обучения, тренировки и тестирования модели.

Сама модель представляла собой комбинацию нейросетей двух типов — полносвязной сети и рекуррентной сети с долгой краткосрочной памятью. Вместе они решали задачу классификации, и на выходе алгоритм выдавал вероятности разных механизмов реакций.

Далее химики провели обучение, причем в некоторые наборы кинетических данных ученые специально ввели ошибки в измеренных концентрациях (до стандартного отклонения в два процента), чтобы алгоритм научился работать с реальными экспериментальными данными.

Обученную модель протестировали на 100000 наборах кинетических данных — по пять тысяч наборов на каждый из 20 механизмов. Точность модели составила 92,6 процента — это значит, что 92,6 процента предсказаний модели совпали с тем, какой механизм химики выбрали для вычисления зависимостей. Причем неточность во многих случаях была связана не с ошибками модели, а с возможностью приписать одному набору кинетических кривых сразу несколько механизмов. Например, зависимости концентрации субстрата от загрузки катализатора для механизмов M11 (дезактивация свободного катализатора) и M14 (дезактивация комплекса субстрат-катализатор) очень похожи, а иногда почти не различимы. Поэтому точно предсказать механизм в случае, если дополнительных данных нет, невозможно. И когда химики учли возможность того, что под одни данные могут подходить несколько механизмов, рассчитанная точность модели составила 99,96 процента (38 ошибок из 100000 тестов). А в случае, когда исследователи использовали кинетические данные с ошибками в измеренных концентрациях (до стандартного отклонения в два процента), точность понизилась до 99,6 процента.

Так химики разработали алгоритм для быстрой интерпретации сложных наборов кинетических данных. Они применили его для анализа опубликованных данных шести разных каталитических процессов (например, раз и два). И в пяти случаях предсказанные моделью механизмы совпали с мнением авторов соответствующих статей. А в шестом случае алгоритм предсказал несколько равновероятных механизмов, и для выбора одного из них данных, приведенных в статье, не хватило.

Ранее мы рассказывали о том, как химики успешно использовали машинное обучение для поиска наиболее подходящих условий реакции Судзуки.

Нашли опечатку? Выделите фрагмент и нажмите Ctrl+Enter.
Химики превратили порфириновые цепи в молекулярные магниты

В этом им помог атомно-силовой микроскоп