Программу для планирования химического синтеза научили обходить патенты

Karol Molga et al. / Chem, 2019

Польские исследователи адаптировали программу Chematica, применяемую для планирования путей синтеза, для нахождения таких путей синтеза, которые не нарушают существующие патенты. Это стало возможным благодаря применению техники ретросинтетического анализа и «блокировке» ключевых химических связей, описываемых в патентах. В качестве примера исследователи нашли альтернативные пути синтеза для трех популярных препаратов. Статья с описанием метода опубликована в журнале Chem.

На сегодняшний день планирование путей синтеза происходит не только вручную, но и с помощью автоматизированных программ. Они имеют доступ к базам данных о различных реакциях, а также свойствам веществ. В результате ученый может задать конечное вещество и найти последовательность необходимых реакций для его синтеза. Одну из таких программ под названием Chematica в 2012 году создала группа ученых под руководством автора новой работы Бартоша Гржибовского (Bartosz Grzybowski). Однако, наличие программы для поиска путей синтеза не решает одну важную проблему — многие вещества, используемые в качестве коммерческих лекарств, защищены патентами, описывающими множество возможных путей их синтеза.

Гржибовский и его коллеги из Института органической химии Польской академии наук научились использовать Chematica для поиска новых путей синтеза, не описанных в патентах. Для этого они написали дополнительные алгоритмы, которые могут быть применены и для других аналогичных программ. Исследователи применили метод ретросинтетического анализа, при котором конечное вещество разбивается на более простые прекурсоры. Благодаря множеству таких разбиений в результате анализа зачастую удается найти достаточно простые и недорогие исходные вещества, пригодные для коммерчески выгодного синтеза. Однако в случае с популярными лекарствами многие очевидные пути разъединений молекул (этим термином в ретросинтетическом анализе принято называть процесс разрыва химической связи с последующим образованием двух или более веществ) уже описаны и могут нарушать патенты. В качестве примера ученые показали все описанные пути синтеза трех важных лекарств: линезолида, используемого в качестве антибиотика последнего резерва, ситаглиптина, применяемого для лечения сахарного диабета 2 типа, а также антиракового вещества панобиностата.

Прописывать все исключения вручную — достаточно трудоемкая задача, которая, к тому же, может не принести результата, потому что помимо непосредственно описанных в патентах прекурсоров и реакций существуют их химические аналоги, которые будут восприниматься программой как подходящие, но фактически также не помогут обойти патенты. Вместо этого ученые научили алгоритм определять химические связи в веществах, разрыв или соединение которых наиболее часто встречается в патентах, а значит являющиеся ключевыми в описанных методах синтеза, и исключать именно их.

Несмотря на то, что часть путей синтеза и веществ-прекурсоров оказываются недоступными в таком случае, программа все равно может находить подходящие методы благодаря базе, содержащей данные о примерно 60 тысячах типах реакций и 7 миллионов известных веществ, из которых примерно о 200 тысячах известна цена, что позволяет сразу оценивать стоимость синтеза. Авторы протестировали метод на трех популярных лекарственных веществах — линезолиде, ситаглиптине и панобиностате — и в течение нескольких минут получили для них новые пути синтеза, не нарушающие патенты.

В 2017 году американские ученые разработали программу, систематизирующую информацию о методах получения материалов, описанных в научных публикациях. Кроме того, на основе этих данных она способна предсказывать исходы аналогичных реакций с похожими материалами, которых еще нет в базе данных.

Григорий Копиев

Нашли опечатку? Выделите фрагмент и нажмите Ctrl+Enter.