Американские ученые пришли к выводу, что компьютерные игроки, использующие краудсорсинговую платформу, способны предсказывать кристаллическую структуру белков более эффективно, чем специалисты или компьютерные алгоритмы. Результаты работы опубликованы в журнале Nature Communications.
Предсказание структуры белка (конфигурации в пространстве, которую принимает его аминокислотная последовательность) имеет фундаментальное значение для медицины, биотехнологий, биоинформатики и теоретической физики. При этом сложный и трудоемкий процесс предсказания в современных условиях имеет ограниченную точность — около 85 процентов содержащихся в базах данных моделей кристаллических структур белков содержат существенные ошибки. Поэтому ученые постоянно работают над совершенствованием методик предсказания с целью максимально повысить их точность. В последнее время значительно повысился интерес к использованию в этих целях распределенных вычислений, машинного обучения и краудсорсинговых платформ.
Сотрудники Университетов Мичигана, Вашингтона, Массачусетса и Северо-Восточного университета в Бостоне провели соревнование по предсказанию структуры белка по карте электронных плотностей, полученной методом рентгеновской кристаллографии. В нем приняли участие два квалифицированных специалиста, 61 студент-биохимик (все они использовали специальное программное обеспечение), два различных компьютерных алгоритма (Phenix Autosolve и MR-Rosetta) и игроки в онлайновую игру Foldit, которых в итоге набралось 469 человек. Задача этой игры состоит в ручном подборе конфигурации белка, имеющей наименьшую энергию, поскольку такая его трехмерная структура с наибольшей вероятностью соответствует реальности. Чем более правдоподобна конфигурация, тем больше пользователь получает очков. Геймеры могут кооперироваться и составлять команды, работающие над одним и тем же белком.
В качестве исходного материала всех участников снабдили аминокислотной последовательностью, предсказаниями вторичной структуры и картой электронных плотностей дрожжевого белка YPL067C. Этот белок был выбран потому, что он не имеет значительного сходства с какой-либо структурой из всемирной базы данных Protein Data Bank (PDB). Кроме того, как было показано в предыдущих работах, YPL067C может предотвращать токсическое действие амилоида — белка, накопление которого в мозге лежит в основе развития болезни Альцгеймера.
Соревнующиеся использовали различные подходы к решению задачи. Ученые и студенты работали поодиночке, в основном полагаясь на поиск подходящих позиций для крупных ароматических аминокислот. Среди игроков в Foldit наилучший результат показала группа, участники которой объединили усилия: один выступал первопроходцем, расставляющим ключевые элементы, а остальные проводили тонкую доводку структур, используя разнообразные подходы и приемы (на видео ниже).
Ученые проверили результаты с помощью специальной программы Molprobity, сравнив ключевую кристаллографическую статистику полученных моделей. Результат игроков в Foldit потребовал коррекции (удаления неорганизованных аминокислотных остатков), связанной с ограничениями игрового процесса. В итоге наилучшая из моделей, созданных геймерами, стала победителем соревнования и одной из лучших моделей схожего разрешения (1,95±0,25 ангстрем) в PDB.
«Это показывает, что любой человек с хорошим трехмерным воображением может сделать нечто, ранее доступное только ученым, и таким способом помочь научному прогрессу», — прокомментировал результаты исследователь Джеймс Бардуэлл (James Bardwell). Другой автор работы Скотт Хоровитц (Scott Horowitz) выразил намерение использовать Foldit для обучения студентов. Ученые также планируют включить некоторые приемы, придуманные геймерами, в лабораторное программное обеспечение.
Первая версия игры Foldit, разработанной в Вашингтонском университете как площадка для краудсорсинговых исследований, стала доступна в мае 2008 года. За время ее существования геймеры помогли сделать несколько важных открытий. Так, в 2010 году более 57 тысяч игроков, предсказавших структуру белка точнее, чем машинный алгоритм, были коллективно указаны в качестве авторов публикации в журнале Nature. Годом позже любители Foldit помогли выяснить кристаллическую структуру ретровирусной протеазы обезьяньего вируса Мэйсона-Пфайзера — на решение задачи, с которой никто не мог справиться в течение 15 лет, у них ушло всего 10 дней. В 2012 году геймеры cмогли усовершенствовать искусственный фермент, разработанный компьютерным моделированием для катализа реакции Дильса-Альдера — добавление 13 аминокислот повысило активность фермента более чем в 18 раз. Впоследствии катализирующий эту реакцию фермент обнаружили в живой природе.
Олег Лищук