Химические свойства молекул определили с помощью машинного обучения

Графическое представление ошибок при вычислении электронной плотности в бензоле

Felix Brockherde et al / Nature Commenications

Разработанный международной группой ученых метод машинного обучения позволяет обойти прямое решение уравнений Кона-Шема и найти электронную плотность реальных молекул, живущих в трех измерениях. Работу метода исследователи проверили на молекулах бензола и этана, а также определили химические свойства молекулы малондиальдегида. Статья опубликована в журнале Nature Communications.

В настоящее время теория функционала плотности Кона-Шема (Kohn-Sham DFT) активно применяется для численных расчетов во многих областях науки (особенно в материаловедении и химии). Обычно достаточная точность достигается с помощью обменных корреляционных приближений (XC approximations), например, обобщенных градиентных аппроксимаций. Такие расчеты играют ключевую роль для понимания химических свойств молекул и поиска новых соединений.

В принципе, основное энергетическое состояние молекулы можно найти, напрямую решив уравнения Кона-Шэма (Kohn-Sham equations), но обычно его рассчитывают в три этапа. Сначала выводят из функционала энергии Кона-Шэма уравнение Эйлера и решают его, чтобы найти электронную плотность. Затем рассчитывают энергию системы и минимизируют ее. В данной статье авторы предлагают пропустить первые два шага с помощью машинного обучения, которое позволит найти электронную плотность напрямую.

Работа программы, разработанной учеными, схематически можно представить как следующую цепочку действий. Для начала потенциал молекул приближается гауссовыми функциями. Затем модель тренируется с помощью метода регуляризации Тихонова (Kernel ridge regression),  предсказывает каждый базисный коэффициент плотности и находит собственно электронную плотность. Более подробно последовательность изображена на рисунке.

Сначала исследователи проверили работу нового метода в одномерном случае. Для этого они рассмотрели около двухсот различных конфигураций трех гауссовых потенциалов (что может моделировать молекулу воды, например) и натренировали модель, точно решая уравнение Шредингера для одного электрона. Оказалось, что точность нового метода растет с числом точек тренировки, и погрешности расчетов в новой модели меньше, чем в предыдущих (в некоторых случаях до трех раз).

Потом ученые исследовали с помощью разработанного метода молекулы бензола, этана и малондиальдегида. Для этого они также натренировали модель на небольшом наборе точно рассчитанных данных и нашли с ее помощью основные энергетические состояния молекул. Во всех случаях погрешности метода составили менее одной килокалории на моль. Также с его помощью ученые установили, какой из изомеров малондиальдегида является более устойчивым.


Попытки применить идеи машинного обучения для расчета электронной плотности и основных энергетических состояний систем предпринимались и раньше, но все предыдущие работы не могли обеспечить достаточную точность в пространстве размерности больше одного. В данной статье ученым впервые удалось применить эти идеи для вычисления параметров реальных трехмерных молекул и их химических свойств.

Численные методы активно используются в различных областях науки. Например, недавно мы писали, как российские физики открыли новую форму алюминия с помощью теории функционала плотности. Или как ученые исследовали пластическую деформацию металлов при помощи молекулярной динамики.

Дмитрий Трунин

Нашли опечатку? Выделите фрагмент и нажмите Ctrl+Enter.