Достоверно красиво: как мы сделали 3D-модель SARS-CoV-2

Мнение редакции может не совпадать с мнением автора

Молекулярный биолог Валерия Архипова и CGI художник Алексей Солодовников создали атомарную модель вируса SARS-CoV-2 и анимировали ее. По просьбе N + 1 они рассказывают, как много сил и времени заняла у них эта работа и какие данные им потребовались, чтобы построить изображение, которое одновременно было бы достоверным и при этом красивым.

Наш вирус, помимо молекул оболочки (о том, почему они именно такие, подробнее расскажем ниже), собран из белков трех типов и олигосахаридных остатков на их поверхности.

S-белки (бирюзовые), они же спайк-белки или белки шипа — их вирус использует для того, чтобы прикрепляться к клеткам. Если эти белки свою работу делают хорошо, то вирус пробирается в клетку и переходит к размножению внутри нее.

M-белки (зеленые) отвечают за контроль сборки новых вирионов в клетках-хозяевах. Этот белок представляет собой своеобразный каркас, на котором организуются в новый вирион другие структурные белки, а также помогает «новорожденному» вириону выбраться из клетки.

Е-белки (красные), взаимодействуют с другими структурными белками, а также, будучи трансмембранными белками, образуют ионный канал, тем самым помогая сборке новых вирионов в комплексе Гольджи клетки-хозяина.

А олигосахаридные остатки (оранжевые) работают «камуфляжем» для вируса. Вирус, прикрываясь ими, прячется от иммунной системы организма — клеткам иммунитета сложнее узнать обвешанного сахарами пришельца и, соответственно, начать выработку антител против него.

Другие модели

Изображения вируса, которые можно найти в открытом доступе, делятся на два типа: художественные иллюстрации без опоры на молекулярную биологию и работы ученых, где в приоритете — научная достоверность, а не эстетическая привлекательность.

Мы подумали, что можем совместить эти подходы: соблюсти достоверность и одновременно сделать изображение насыщенным. Показать и сложность, и красоту.

Любая модель вируса может состоять из двух крупных частей: внешняя часть и внутренняя, в которая спрятана внутри вириона. Мы сделали только наружную часть (как и многие другие), наш вирус пустой внутри. Задача по моделированию «начинки» сложнее — об этом мы поговорим в конце статьи.

Конечно, работали мы не в информационном вакууме. Есть и другие модели — они нас вдохновляли и учили. Нам хотелось сделать не хуже или добавить что-то свое. Вот на какие модели мы обратили внимание, прежде чем заняться своей:

Это видео показало, что мы можем сделать нашу модель цветной, эстетически привлекательной. Выделить цветом разные части вируса, что улучшает восприятие изображения. Плюс здесь мы впервые увидели движение вируса — на изображениях, которые мы видели до этого, вирус всегда выглядел статично. 

Данная работа показала, что мы можем уточнить структуру самого вируса, сделать ее атомарной. Это многократно повысило сложность модели, но и ее достоверность также возросла.

Тут мы увидели, что количество ключевых белков у вируса может быть очень различным. Мы приняли решение сосредоточиться на уточнении их количества, отдавая предпочтение самым новым источникам.

Эта работа начинается с 2D-иллюстрации ученого и художника Дэвида Гудселла (David S. Goodsell). Мы увидели, насколько важно придумать и выдержать цветовое решение модели вируса. В итоге, прежде чем мы дошли до финала, было отвергнуто 11 разных цветовых решений.

И последняя работа — это модель студии Visual Science. Эта модель показала, что наше решение сделать атомарную модель вируса — совершенно правильное. Также мы поняли, что число ключевых белков на поверхности вируса может сильно варьироваться. Мы приняли решение сосредоточиться на уточнении их количества, отдавая предпочтение самым новым научным источникам. Также мы увидели новую крупную задачу — сделать модель внутренней части вируса. Эту задачу мы оцениваем, как более сложную и не менее важную.

Все модели выше в большинстве своем сделаны крупными научными коллективами с привлечением значительных вычислительных ресурсов (облака, фермы, кластера). Нам было интересно, что может сделать наша команда из двух человек.

Источники данных

Часть белков на нашей иллюстрации взяты из базы

. Каждый белок — это отдельный файл, внутри которого хранятся координаты атомов белка, а также дополнительная информация: химический состав, аминокислотный, интенсивность колебаний атомов и тому подобное.

Для разных белков в Protein Database используют разные подходы к помещению атомов исследуемой молекулы в систему координат. Так, например, в прямоугольных декартовых координатах ось Z совмещается с максимальным значением момента инерции (для горизонтального расположения фрагмента белка) или совпадает с минимальным значением момента инерции (в случае вертикального расположения). Другой вариант используют для исследования длинных спиралевидных молекул: при этом ось X соответствует среднему значению момента инерции эллипсоида. Также широко используются сферические, цилиндрические и другие системы координат, которые потом пересчитываются в декартовы при создании PDB-файла.

По сути, формат PDB — это текстовый файл с данными про каждый атом. Вот как записывают, например, структуру Е-белка 5X29:

А вот как эта же информация выглядит уже в

— программе, в которой данные из pdb-файлов преобразуются в 3D-модель, а затем в иллюстрацию.

Таким образом мы получили геометрическую, атомарно правильную структуру узлов вируса.

PDB — очень ценный источник информации, без него у нас бы ничего не получилось. Это огромная — 178 938 биологических макромолекулярных структур на июнь 2021 года — международная база, которую пополняют ученые со всего мира, выкладывая данные своих исследований в открытый доступ.

Молекул оболочки нового коронавируса в полном виде в библиотеке PBD нет. Мы взяли оттуда липиды, из которых она может состоять, и построили ее самостоятельно. Вирус собирает свою оболочку из фрагментов мембраны клетки-хозяина — этот суперкапсид способствует повышению заразности вируса. Суперкапсид нашего вируса построен из липидов мембраны клетки эпителия. 

Далее нам нужно было определить количество объектов, из которых состоит вирус, и предсказать их движение. В нашей модели мы отобразили все атомы, которые есть в исходных данных, без упрощения. Вот что у нас получилось сначала:

Затем нам удалось получить консультацию экспертов. Это позволило повысить точность нашей модели. Мы чрезвычайно признательны Николаю Никитину с кафедры вирусологии МГУ и Софье Борисевич из лаборатории химической физики Уфимского Института химии РАН. Вместе с ними мы уточнили количество S-белков, которое зависит от размера вириона (сам он составляет 50-200 нанометров). По последним данным их не 90, как было в первой версии нашей иллюстрации, а меньше — от 26 до 41-го. На нашей модели S-белков 38. 

Также большим сюрпризом для нас оказалась подвижность S-белка:

У его «ножки» два колена, что дает ей большую степень свободы на изгиб. Помимо наклонов, шип может еще и вращаться вокруг продольной оси. Такая степень свободы косвенно подтверждает нашу гипотезу, что вирион не может быть плотно усеян S-белками, как было в нашей ранней модели — тогда они мешали бы друг другу. А если подвижность S-белка нарушена, то ему сложнее связаться с рецептором ACE2. Ограничение подвижности S-белков, кстати, один из способов предотвратить заражение клеток вирусами. 

Помимо этого, мы выяснили, что M-белки расположены на оболочке намного плотнее — их стало около 1000 штук на вирион. А E-белков, как минорной компоненты, напротив, очень мало. В нашем случае их 15 штук на вирион.

Оболочка вируса на первый взгляд кажется очень жестким панцирем, чем-то близким по своим свойствам корпусу подводной мины. Но это не так: ее форма, во-первых, не является правильной сферой, а кроме того она еще и постоянно меняется. Но хотя свойства оболочки и можно представить как «жидкий кристалл», S-белки жестко в ней закреплены, их «ножки» неподвижны.

Как моделировали

Вот как выглядит 3D-модель вируса в Houdini:

Houdini используется для создания спецэффектов в кино и рекламе: взрывы, дым, вода, огонь, разрушения. Подошел он и для наших задач. Внешняя часть вируса нашей модели — приблизительно 25 000 000 атомов. Просчет изображения с материалами и светом выполнялся на GPU рендере RedShift. По сравнению с CPU (16-ядерный AMD против 3080 NVIDIA), прирост по скорости около семи раз. Модель вируса может быть посчитана в очень больших разрешениях. Рендер для фрагмента, на котором хорошо видны атомы, сделан в 8000х8000 пикселей, что эквивалентно 1300х1300 миллиметрам при печати в 150 точек на дюйм.

Вирус рендерился в черно-белом виде. И дальше уже по маскам красился вручную в программе для композитинга и монтажа — DaVinci Resolve. Такой подход позволил подобрать цветовую гамму без пересчета модели. Всего было испробовано порядка десяти вариантов цветовых решений. Ниже — не раскрашенная модель вируса.

А вот фрагмент вируса, S-белок — немного ближе.

SARS-CoV-2 не похож на монолитное изваяние. Мы сделали анимацию, чтобы показать, как вирус «дышит» — чтобы таким образом подчеркнуть, что это достаточно мягкая структура. Также мы старались показать движение S-белков в диапазоне углов, описанных в последних научных публикациях.

Итого

Моделированием внутренней структуры вируса мы не занимались. Это около 30 000 нуклеотидов РНК, N-белков и других элементов. Эта работа сложнее, чем моделирование внешнего вида вируса. Во многом это связано с отсутствием моделей белков и тем, что для этого нужно решить нетривиальную задачу укладки нити РНК в полости сферы вируса.

Повысить точность нашей модели можно с привлечением молекулярной динамики. Тогда оболочку можно будет изобразить точнее, как и само движение атомов. Молекулярная динамика позволяет получить очень точное представление о движении и взаимодействии частей вируса как друг с другом, так и с внешней средой. Но МД требует специальных навыков работы и очень требовательна к вычислительным ресурсам. У нас нет необходимых мощностей, чтобы работа была выполнена за приемлемые сроки. Поэтому движения атомов и частей вируса показаны условно.

В открытых источниках мы не нашли информации о структуре М-белка. Поэтому и он тоже показан условно. Размеры атомов усреднены.

Вся работа заняла у нас приблизительно полгода: она велась параллельно с другими проектами, после основной работы, домашних дел, с перерывами на болезни и праздники и поправкой на разные часовые пояса.

Мы получили модель вируса, изображения с ним и анимацию его условного движения. Что дальше, что с этим делать и какая от этого польза?

Во-первых, это красиво. Во-вторых, мы показываем сложность объектов на микроскопическом, атомарном уровне. Наша работа позволяет эту сложность увидеть. И последнее — пожалуй, самое важное. Наш проект показывает, что и один человек может сделать очень многое. А значит, может каждый из нас. Дерзайте!

Список литературы

1. Surya, W., Li, Y., Torres, J. Structural model of the SARS coronavirus E channel in LMPG micelles. // Biochim. Biophys. Acta - Biomembr. – 2018. – Vol. 1860. – N. 6. – P. 1309–1317.

2. Koppisetti, R. K., Fulcher, Y. G., Jurkevich, A., Prior, S. H., Xu, J., Lenoir, M., Overduin, M., Van Doren, S. R. Ambidextrous binding of cell and membrane bilayers by soluble matrix metalloproteinase-12. // Nat. Commun. – 2014. – Vol. 5. – P. 1–14.

3. Hillen, H. S., Kokic, G., Farnung, L., Dienemann, C., Tegunov, D., Cramer, P. Structure of replicating SARS-CoV-2 polymerase. // Nature. – 2020. – Vol. 584. – N. 7819. – P. 154–156.

4. Harris, L. J., Larson, S. B., Hasel, K. W., McPherson, A. Refined structure of an intact IgG2a monoclonal antibody. // Biochemistry. – 1997. – Vol. 36. – N. 7. – P. 1581–1597.

5. Noreng, S., Bharadwaj, A., Posert, R., Yoshioka, C., Baconguis, I. Structure of the human epithelial sodium channel by cryo-electron microscopy. // Elife. – 2018. – Vol. 7. – P. 1–23.

6. Almond, A., DeAngelis, P. L., Blundell, C. D. Hyaluronan: The Local Solution Conformation Determined by NMR and Computer Modeling is Close to a Contracted Left-handed 4-Fold Helix. // J. Mol. Biol. – 2006. – Vol. 358. – N. 5. – P. 1256–1269.

7. Hurdiss, D. L., Drulyte, I., Lang, Y., Shamorkina, T. M., Pronker, M. F., van Kuppeveld, F. J. M., Snijder, J., de Groot, R. J. Cryo-EM structure of coronavirus-HKU1 haemagglutinin esterase reveals architectural changes arising from prolonged circulation in humans. // Nat. Commun. – 2020. – Vol. 11. – N. 1. – P. 1–10.

8. Yan, Renhong, Yuanyuan Zhang, Yaning Li, Lu Xia, Yingying Guo, Q. Z. Structural basis for the recognition of SARS-CoV-2 by full-length human ACE2. // Science (80-. ). – 2020. – Vol. 3. – N. 3. – P. 1–8.

9. Javitt, G., Khmelnitsky, L., Albert, L., Bigman, L. S., Elad, N., Morgenstern, D., Ilani, T., Levy, Y., Diskin, R., Fass, D. Assembly Mechanism of Mucin and von Willebrand Factor Polymers. // Cell. – 2020. – Vol. 183. – N. 3. – P. 717-729.e16.

10. Daniel Wrapp, Nianshuang Wang, Kizzmekia S. Corbett, Jory A. Goldsmith, Ching-Lin Hsieh, Olubukola Abiona, B. S. G., McLellan, and J. S. Cryo-EM structure of the 2019-nCoV spike in the prefusion conformation. // Science (80-. ). – 2020. – Vol. 21. – N. 1. – P. 1–9.

11. Wang, M. Y., Zhao, R., Gao, L. J., Gao, X. F., Wang, D. P., Cao, J. M. SARS-CoV-2: Structure, Biology, and Structure-Based Therapeutics Development. // Front. Cell. Infect. Microbiol. – 2020. – Vol. 10. – N. November. – P. 1–17.

12. Yao, H., Song, Y., Chen, Y., Wu, N., Xu, J., Sun, C., Zhang, J., Weng, T., Zhang, Z., Wu, Z., Cheng, L., Shi, D., Lu, X., Lei, J., Crispin, M., Shi, Y., Li, L., Li, S. Molecular Architecture of the SARS-CoV-2 Virus. // Cell. – 2020. – Vol. 183. – N. 3. – P. 730-738.e13.

13. Oostra, M., de Haan, C. A. M., de Groot, R. J., Rottier, P. J. M. Glycosylation of the Severe Acute Respiratory Syndrome Coronavirus Triple-Spanning Membrane Proteins 3a and M. // J. Virol. – 2006. – Vol. 80. – N. 5. – P. 2326–2336.

14. B.W. Neuman, M. J. B. Supramolecular Architecture of the Coronavirus Particle. // Adv. Virus Res. – 2020. – Vol. 96. – P. 1–27.

15. Neuman, B. W., Kiss, G., Kunding, A. H., Bhella, D., Baksh, M. F., Connelly, S., Droese, B., Klaus, J. P., Makino, S., Sawicki, S. G., Siddell, S. G., Stamou, D. G., Wilson, I. A., Kuhn, P., Buchmeier, M. J. A structural analysis of M protein in coronavirus assembly and morphology. // J. Struct. Biol. – 2011. – Vol. 174. – N. 1. – P. 11–22.

16. Yu, A., Pak, A. J., He, P., Monje-Galvan, V., Casalino, L., Gaieb, Z., Dommer, A. C., Amaro, R. E., Voth, G. A. A multiscale coarse-grained model of the SARS-CoV-2 virion. // Biophys. J. – 2021. – Vol. 120. – N. 6. – P. 1097–1104.

17. Yao, H., Song, Y., Chen, Y., Wu, N., Xu, J., Sun, C., Zhang, J., Weng, T., Zhang, Z., Wu, Z., Cheng, L., Shi, D., Lu, X., Lei, J., Crispin, M., Shi, Y., Li, L., Li, S. Molecular architecture of the SARS-CoV-2 virus. // Cell. – 2020. – Vol. 183. – N. 3. – P. 730–738.

18. Choi, Y. K., Cao, Y., Frank, M., Woo, H., Park, S. J., Yeom, M. S., Croll, T. I., Seok, C., Im, W. Structure, Dynamics, Receptor Binding, and Antibody Binding of the Fully Glycosylated Full-Length SARS-CoV-2 Spike Protein in a Viral Membrane. // J. Chem. Theory Comput. – 2021. – Vol. 17. – N. 4. – P. 2479–2487.

В работе использованы белки из PDB: 6vsb, 2mls, 5x29, 6yyt.




Нашли опечатку? Выделите фрагмент и нажмите Ctrl+Enter.