Программу для планирования химического синтеза научили обходить патенты

Польские исследователи адаптировали программу Chematica, применяемую для планирования путей синтеза, для нахождения таких путей синтеза, которые не нарушают существующие патенты. Это стало возможным благодаря применению техники ретросинтетического анализа и «блокировке» ключевых химических связей, описываемых в патентах. В качестве примера исследователи нашли альтернативные пути синтеза для трех популярных препаратов. Статья с описанием метода опубликована в журнале Chem.

На сегодняшний день планирование путей синтеза происходит не только вручную, но и с помощью автоматизированных программ. Они имеют доступ к базам данных о различных реакциях, а также свойствам веществ. В результате ученый может задать конечное вещество и найти последовательность необходимых реакций для его синтеза. Одну из таких программ под названием Chematica в 2012 году создала группа ученых под руководством автора новой работы Бартоша Гржибовского (Bartosz Grzybowski). Однако, наличие программы для поиска путей синтеза не решает одну важную проблему — многие вещества, используемые в качестве коммерческих лекарств, защищены патентами, описывающими множество возможных путей их синтеза.

Гржибовский и его коллеги из Института органической химии Польской академии наук научились использовать Chematica для поиска новых путей синтеза, не описанных в патентах. Для этого они написали дополнительные алгоритмы, которые могут быть применены и для других аналогичных программ. Исследователи применили метод ретросинтетического анализа, при котором конечное вещество разбивается на более простые прекурсоры. Благодаря множеству таких разбиений в результате анализа зачастую удается найти достаточно простые и недорогие исходные вещества, пригодные для коммерчески выгодного синтеза. Однако в случае с популярными лекарствами многие очевидные пути разъединений молекул (этим термином в ретросинтетическом анализе принято называть процесс разрыва химической связи с последующим образованием двух или более веществ) уже описаны и могут нарушать патенты. В качестве примера ученые показали все описанные пути синтеза трех важных лекарств: линезолида, используемого в качестве антибиотика последнего резерва, ситаглиптина, применяемого для лечения сахарного диабета 2 типа, а также антиракового вещества панобиностата.

Прописывать все исключения вручную — достаточно трудоемкая задача, которая, к тому же, может не принести результата, потому что помимо непосредственно описанных в патентах прекурсоров и реакций существуют их химические аналоги, которые будут восприниматься программой как подходящие, но фактически также не помогут обойти патенты. Вместо этого ученые научили алгоритм определять химические связи в веществах, разрыв или соединение которых наиболее часто встречается в патентах, а значит являющиеся ключевыми в описанных методах синтеза, и исключать именно их.

Несмотря на то, что часть путей синтеза и веществ-прекурсоров оказываются недоступными в таком случае, программа все равно может находить подходящие методы благодаря базе, содержащей данные о примерно 60 тысячах типах реакций и 7 миллионов известных веществ, из которых примерно о 200 тысячах известна цена, что позволяет сразу оценивать стоимость синтеза. Авторы протестировали метод на трех популярных лекарственных веществах — линезолиде, ситаглиптине и панобиностате — и в течение нескольких минут получили для них новые пути синтеза, не нарушающие патенты.

В 2017 году американские ученые разработали программу, систематизирующую информацию о методах получения материалов, описанных в научных публикациях. Кроме того, на основе этих данных она способна предсказывать исходы аналогичных реакций с похожими материалами, которых еще нет в базе данных.

Григорий Копиев