Химики из университета Глазго разработали универсальный алгоритм, способный переводить текст методик из научных статей в последовательность действий для автоматизации органического синтеза. С помощью разработанной программы исследователи автоматизировали синтез 12 химических соединений, включая лидокаин, передавая алгоритму в качестве вводных данных только тексты методик из научной литературы. Исследование опубликовано в журнале Science.
Развитие методов автоматизации происходит и в химии, в частности исследователи пытаются облегчить трудозатратный процесс синтеза веществ. Ученые создают системы, способные самостоятельно проводить реакции определенного типа. Однако заменить химиков-синтетиков роботами полностью пока нельзя, так как не существует стандартных операционных систем, которые могли бы как человек переводить информацию из методик в последовательность простых действий.
Хессам Мер (S. Hessam M. Mehr) с коллегами из университета Глазго разработали универсальный алгоритм, способный читать статьи, формируя последовательность действий для автоматизации органического синтеза. В тексте методики программа выявляла маркировочные слова, которые описывают процессы синтеза (добавить, смешать, отфильтровать, нагреть и тому подобные) и составляла их в контекстный алгоритм, по которому можно было синтезировать нужное вещество. Интерфейс программы позволял редактировать этапы алгоритма пользователям, не владеющим навыками программирования. Затем виртуальная машина преобразовывала этот текст в простые операции, которые могли выполняться роботами напрямую.
В тексте статьи алгоритм искал паттерны, которых он знал более 16 тысяч, по которым определял параметры синтеза вроде названий реагентов, нужных объемов и температур.
Последовательность действий без контекста вряд ли оказалась бы пригодной для автоматизации синтезов. Разработанный алгоритм умел «читать» статьи, понимая контекст, и преобразовывать сложные методики в элементарные команды для роботов. Виртуальная машина разбивала каждый из пунктов методики на простые операции, которые мог выполнить робот. Например, слово «перекристаллизовать» состояло из подопераций: нагрев, перемешивание и охлаждение, а время этой операции определялось временем охлаждения смеси.
Свои разработки исследователи опробовали с помощью робота Chemputer. Без какого-либо внешнего вмешательства человека система провела 12 синтезов, «прочитав» методики. Программа включала нужные насосы, крутила клапаны, подобрала колбу нужного объема, в которой проводила реакции, перемешивала, правильно отфильтровала, добавляла растворители в нужный момент, нагревала и разделяла несмешивающиеся жидкости. Выход лидокаина у автоматизированной системы составил 53 процента.
Авторы планируют развивать систему и научить ее распознавать именные реакции, автоматически исправлять ошибки перевода. Однако, по их словам, представленная система уже важный шаг к полной автоматизации синтеза — от текста к веществу.
Этим летом ученые из Ливерпульского университета представили робота-лаборанта, который мог передвигаться по лаборатории, брать нужную посуду и подбирать оптимальные концентрации для проведения химических реакций.
Исследователи мира также разрабатывают программы, предсказывающие результаты химических реакций. Например, четыре года назад система машинного обучения, разработанная американскими химиками, смогла предсказать результаты химических реакций лучше, чем это удавалось специалистам. А в 2018 году британские исследователи создали робота, способного проводить одностадийный органический синтез и предсказывать вероятности протекания реакций.
Алина Кротова