Разработчики из компании DeepMind создали нейросетевой алгоритм, способный с высокой точностью предсказывать структуру белков на основе соответствующих им нуклеотидных последовательностей. Знание структуры белка позволяет определить его свойства в организме, рассказывают разработчики в своем блоге.
Белки представляют собой линейные молекулы, состоящие из остатков аминокислот, выстроенных в определенном порядке. Однако они существуют не в виде прямой линии, а самопроизвольно складываются в куда более сложные структуры. От того, какую структуру имеет белок, зависит то, какие функции он будет выполнять в организме. Именно поэтому ученые уже десятки лет работают над методами предсказания структуры и функций белка по его аминокислотной последовательности. Но это крайне сложная задача, потому что при расчете сборки белков в структуры более сложных уровней приходится учитывать взаимодействие между большим количеством аминокислот.
Исследователи из DeepMind разработали алгоритм AlphaFold, способный принимать последовательность нуклеотидов, кодирующую белок, и предсказывать на ее основе расстояния между всеми парами аминокислотных остатков и углы между связями, соединяющими аминокислоты. При этом алгоритм выдает не только сами параметры, но и оценивает уверенность их расчета. После расчета параметров алгоритм начинает поиск похожего белка. Также он меняет комбинации фрагментов белков и даже придумывает новые, благодаря чему постепенно система подбирает структуру, максимально соответствующую расчетам.
Для оценки своего алгоритма DeepMind решила принять участие в ежегодном эксперименте CASP (критическая оценка предсказания белковых структур), который оценивает существующие методы моделирования и предсказания структуры белков. В результате алгоритм исследователей занял первое место, показав наивысшую точность среди участников.
В 2016 году исследователи из США показали, что игроки в компьютерные игры, использующие краудсорсинговую платформу, способны предсказывать кристаллическую структуру белков более эффективно, чем специалисты или компьютерные алгоритмы. Во время эксперимента игроки использовали программу, в которой они в ручном режиме подбирали конфигурацию белка, имеющую наименьшую энергию, поскольку такая его трехмерная структура с наибольшей вероятностью соответствует реальности.
Григорий Копиев