Ученые проверили способность нейросетей классифицировать возникающие в химии полимеров узлы. Исследователи протестировали несколько различных архитектур, лучшая из которых показала правильное распознавание в 99 процентов случаев при анализе циклических молекул из ста сегментов. Такой точности уже сегодня достаточно для некоторых применений, а в случае прогресса в будущем нейросетевое определение узлов может стать полноценным методом как в случае физико-химических систем, так и в контексте математики, пишут авторы в журнале Physical Review E.
Узлы повсеместны в окружающей реальности, от спутавшихся в кармане наушников до альпинисткой обвязки. Они также возникают во многих разделах науки, в том числе в физике, химии и биологии. Например, бывают заузленные течения в жидкости, в узлы также скручиваются многие молекулы - в частности, белки и ДНК.
С точки зрения математики узел — это вложение окружности в трехмерное пространство, при этом одинаковые с точностью до непрерывных преобразований (без разрывов) узлы считаются эквивалентными. Известно, что задача о классификации узлов алгоритмически разрешима, но пока не придумано алгоритма полиномиальной сложности даже для распознавания тривиальных узлов, то есть обычных окружностей с точностью до деформаций.
Стандартный подход заключается в поиске топологических инвариантов, по которым можно отличить узлы. Здесь выделяются два направления: полиномиальные инварианты (Александера, Джонса и другие) и гомотопические инварианты (Хованова, Хегора — Флоера и другие). Однако все предложенные методы обладают недостатками. В частности, бесконечно много неодинаковых узлов оказываются неотличимы при использовании полинома Александера, а гомотопии в общем случае нереалистично сложно подсчитать.
Исследователи из Китая и Сингапура под руководством Лян Дая (Liang Dai) из Городского университета Гонконга опробовали принципиально иной метод на основе нейросетей. В отличие от аналитических алгоритмов он не позволяет добиться абсолютной уверенности в ответе, но зато теоретически может работать в недоступных для других способов случаях. Авторы хотели проверить принципиальную возможность использования нейросетей для распознавания узлов, поэтому ограничились пятью разными узлами и двумя нейросетями.
Исследователи использовали нейросеть с прямой связью и рекуррентную нейросеть. Обучающей и тестовой выборкой были проведенные методом Монте-Карло симуляции конфигурации полимера в виде кольца из ста мономеров. В каждом случае тип узла определялся с помощью многочлена Александера, а для нейросетей выбиралось по 200 тысяч или 2 миллиона каждого из пяти видов получаемых узлов. В качестве дополнительного испытания нейросети также определяли тип узла у миллиона полимеров из 60 и 80 мономеров, которых не было в обучающей выборке.
Рекуррентная нейросеть во всех тестах показала себя лучше. Наивысшего результата удалось добиться в случае работы с суммарной выборкой в 2 миллиона полимеров длиной в сто элементов — выше 99 процентов. В то же время максимальная точность более простой нейросети с прямой связью составила всего немногим более 80 процентов. В целом ученые заключают, что их работа вселяет уверенность, что более сложные нейросети в случае наличия достаточно больших обучающих выборок смогут стать мощным инструментом по классификации узлов.
Ранее ученые
среди миллионов молекулярных узлов шесть устойчивых,
прочность веревочного узла из его топологии и
рекордно сложный молекулярный узел.
Тимур Кешелава
В качестве катализатора ученые использовали фенантролиновый комплекс иридия
Химики из США и Украины применили известную реакцию Хартвига для синтеза бор-производных бициклических структур. Оказалось, что в присутствии подходящего 2-метилфенантролинового лиганда для иридиевого предкатализатора реакция идет не хуже, чем с ароматическими соединениями. Исследование опубликовано в Nature Chemistry.