Статистический анализ упростил расшифровку твердотельных ЯМР-спектров

Швейцарские химики научились расшифровывать твердотельные ЯМР-спектры органических соединений с помощью статистического анализа. Ученые использовали известный алгоритм, чтобы создать базу из спектров органических соединений с известной кристаллической структурой. Они применили эту базу для расшифровки твердотельных ЯМР-спектров, причем для отнесения пиков не требовалось знать кристаллическую структуру исследуемых веществ. Работа опубликована в Science Advances.

ЯМР-спектроскопия — необходимый для каждого химика-органика метод исследования молекул. Он основан на взаимодействии ядер атомов с магнитным полем. В результате проведения ЯМР-эксперимента химик получает спектр, в котором каждый сигнал отвечает определенным ядрам атомов, входящих в молекулу. Ядра с разной электронной плотностью вблизи себя дают пики с разными значениями химического сдвига, причем чем больше вблизи ядра электронной плотности, тем сильнее электроны «закрывают» ядро от магнитного поля, и тем меньше его химический сдвиг.

ЯМР-спектры чаще всего регистрируются для растворов веществ. Если же вещество нерастворимо в большинстве растворителей или раствор нужно нагреть выше температуры кипения, на помощь приходит твердотельная ЯМР-спектроскопия. Как правило, твердотельные спектры имеют меньшее разрешение из-за анизотропных эффектов, и сигналы ядер часто накладываются друг на друга.

ЯМР-спектроскопия позволяет подтверждать структуру веществ, проводить исследования скоростей реакций, изучать их механизмы. Но для любого такого исследования химику нужно сначала расшифровать ЯМР-спектр, то есть понять, какому атому соответствуют каждый сигнал. Как правило, в случае сложных молекул с этим могут помочь многомерные ЯМР-эксперименты. Они очень информативны, но иногда требуют слишком много времени на регистрацию.

Химики под руководством Линдона Эмсли (Lyndon Emsley) из Федеральной политехнической школы Лозанны предложили способ проводить отнесение пиков твердотельных спектров с помощью статистического подхода. Они выбрали 205069 кристаллических структур из Кембриджской базы данных (Cambridge Structural Database) и предсказали твердотельные углеродные (13C) спектры этих веществ ранее разработанным алгоритмом ShiftML.

Далее химики решили использовать их базу для отнесения пиков нерасшифрованных спектров. В качеcтве модели они выбрали спектр теофиллина. Программа, написанная авторами, построила молекулярные графы для каждого атома этого соединения, а затем нашла аналогичные графы в созданной ранее базе. Химики настроили глубину графов так, чтобы в базе всегда было как минимум 10 совпадений.

Исходя из значений химических сдвигов в найденных структурах, программа построила статистические распределения для химических сдвигов каждого ядра теофиллина. А затем, пользуясь теоремой Байеса, нашла вероятности различных отнесений для целой молекулы. Кроме того, для удобства интерпретации ученые рассчитали частные распределения вероятностей для каждого атома. В случае теофиллина оказалось, что наиболее вероятные отнесения совпадают с найденными экспериментально.

Чтобы испытать метод на большой выборке молекул, ученые предсказали спектры для 100 случайно выбранных кристаллических структур с помощью ShiftML, а затем рассчитали отнесения для каждой молекулы с помощью своей программы. Кроме того, химики опробовали их метод на 10 молекулах с экспериментально известными отнесениями. Оказалось, что в 80 процентах случаев отнесения программы совпадают с найденными из кристаллической структуры или эксперимента. Так, авторы научились с высокой точностью расшифровывать твердотельные спектры без знания кристаллической структуры исследуемых веществ.

Помимо ЯМР-спектроскопии, для исследования органических соединений ученые часто применяют оптическую спектроскопию. Про ее историю вы можете прочитать в нашем материале «Химия в солнечном свете».

Михаил Бойм