Машинное обучение помогло найти оптимальные условия реакции Судзуки

Выход описанных в литературе реакций повысился в два раза

Химики из США, Канады и Южной Кореи смогли оптимизировать условия реакции кросс-сочетания по Судзуки с помощью машинного обучения. Благодаря установке по автоматизированному проведению и анализу реакций и подобранному способу обучения ученым удалось повысить средний выход описанных в литературе реакций в два раза. Исследование опубликовано в Science.

Реакция Судзуки представляет собой сочетание двух молекул: бороновой кислоты и органического галогенида. Под действием катализатора на основе палладия и в присутствии основания эти молекулы объединяются с образованием связи углерод-углерод. Такие сочетания очень популярны в медицинской химии, потому что это часто дает хорошие выходы и позволяет легко варьировать заместители (органические фрагменты) на нужной молекуле. Для этого достаточно получить один галогенид и несколько бороновых кислот, а затем проводить сочетание галогенида с каждой из них.

Одна из проблем реакции Судзуки заключается в том, что некоторые бороновые кислоты нестабильны — они разлагаются при хранении. Особенно это характерно для кислот на основе гетероциклических соединений, которые приходится часто применять для синтеза лекарственных преператов. Но в 2009 году химики из США предложили использовать вместо бороновых кислот боронаты на основе N-метилиминодиуксусной кислоты. В них атом бора связан с двумя атомами кислорода и дополнительно стабилизирован атомом азота. Благодаря этому такие соединения стабильны при хранении на воздухе при комнатном освещении. В целом, разработка американских ученых оказалась очень продуктивной и позволила получать гетероциклические продукты реакции Судзуки с высокими выходами.

Несмотря на то что, казалось бы, наиболее удобный и надежный способ проводить реакцию Судзуки уже найден, химики под руководством Мартина Берка (Martin D. Burke) из Иллинойсского университета решили улучшить ее условия с помощью машинного обучения. Для этого ученые выбрали около 5400 разных коммерчески доступных гетероциклических соединений, из которых с помощю кластеризации выбрали 54 самых отличающихся по структуре гетероциклов для дальнейших исследований. Далее, чтобы еще сильнее сократить датасет, ученые применили алгоритм, основанный на концепции химического подобия. Это позволило удалить наиболее похожие структуры и оставить наиболее разнообразные. В результате химикам удалось выделить 11 пар боронат-галогенид для поиска оптимальных условий реакции.

Чтобы проводить реакции Судзуки, ученые использовали установку по автоматическому синтезу, в которой все реакции шли в одинаковых условиях, а выходы машина измеряла автоматически с помощью хроматомасс-спектрометрии или УФ-спектроскопии. Начали химики с проведения реакций Судзуки между 11 парами субстратов с несколькими палладиевыми катализаторами в разных растворителях и в присутствии разных оснований (каждую реакцию для надежности повторили два раза). Полученных данных хватило для того, чтобы начать обучение модели.

Химики использовали алгоритм на основе стандартной байесовской оптимизации в комбинации с активным обучением (при таком обучении машина периодически запрашивает у пользователя нужные ей данные) для того, чтобы не проводить все возможные эксперименты с 11 субстратами. При этом точность предсказания машина оценивала сама с помощью регрессии Гауссовского процесса после каждого цикла оптимизации.

В процессе анализа химикам пришлось провести еще около 200 реакций. И после пяти циклов оптимизации ученые решили протестировать найденные оптимальные условия — смесь диоксана и воды в качестве растворителя, комплекс палладия с лигандом XPhos в качестве катализатора, карбонат натрия в роли основания и температура в 100 градусов Цельсия.

Выяснилось, что найденные условия позволяют значительно повысить конверсию исходных и отношение количества нужного продукта к количеству побочных продуктов, по сравнению с экспериментами, описанными ранее. Так, средний выход 20 протестированных реакций составил 46 процентов — в два раза больше, чем в статье 2009 года.

Хотя кросс-сочетания открыли еще в конце прошлого века, для них продолжают находить новые катализаторы. Например, недавно мы рассказывали о том, как химики впервые провели реакцию Хека на золотом катализаторе.

Нашли опечатку? Выделите фрагмент и нажмите Ctrl+Enter.
Демон Максвелла помог создать градиент концентрации азобензола

В качестве демона выступил комплекс железа