Так искусственный ты или нет?

Разбираем новый аргумент в пользу рукотворности SARS-CoV-2

Конспирологических теорий о происхождении SARS-CoV-2 за два с половиной года накопилось немало. Некоторые из них не вышли за пределы слухов и локальных чатов, другие добрались до американского сената. Но ни одна из теорий лабораторного происхождения нового коронавируса пока не получила признания в научном сообществе. Недавно один немецкий и двое американских биологов сформулировали очередное доказательство рукотворности вируса. По просьбе N+1 биохимик Георгий Куракин, ассоциированный член Королевского биологического общества, рассказывает о том, как лабораторное происхождение SARS-CoV-2 попытались доказать на этот раз через статистику — и почему эта попытка ученых не убедила.

Хотя считается, что SARS-CoV-2 пришел к людям от летучих мышей, поймать ту самую роковую летучую мышь пока не удалось. Мы даже не знаем, кто первый подхватил новую болезнь (подробнее о поисках «нулевых пациентов» читайте в материале «Дары любви»). Поэтому некоторые политики до сих пор занимаются расследованиями в надежде поймать за руку незадачливого лаборанта — или, наоборот, злого гения — который создал новый вирус и позволил ему сбежать на свободу. А вирусологи всматриваются в единственный надежный источник информации о происхождении коронавируса — его геном.

Время от времени отдельные ученые объявляют, что наконец-то разглядели в нем следы лабораторных манипуляций (о предыдущих заявлениях такого рода читайте в материале «Сам ты искусственный»). Но при ближайшем рассмотрении все эти подозрения оказывались беспочвенными.

Что они ищут

На первых этапах искать пытались самый очевидный признак лабораторного происхождения SARS-CoV-2 — так называемую «склейку». Если бы вдруг выяснилось, что геном вируса состоит из кусочков неродственных друг другу вирусов, которыми они вряд ли могли бы обменяться в естественных условиях, то это было бы сильным доводом в пользу того, что в мир вырвалась созданная в лаборатории химера.

Новый коронавирус не выглядит «склеенным» в лаборатории — отличия от известных вирусов разбросаны по всему его геному. Другое дело, что склеенным мог бы оказаться небольшой его кусочек — ген S-белка, которым вирус связывается с рецептором ACE2 на клетке хозяина. Нуклеотидная последовательность, которая соответствует участку связывания S-белка, отличается от своего гомолога у ближайшего родственника RaTG13 (коронавируса летучих мышей) сильнее, чем остальные участки генома.

Но сам по себе этот факт ничего не говорит о происхождении. Различия могут возникнуть и при естественной рекомбинации между вирусными геномами, которая происходит очень часто.

В начале пандемии вирусологи предположили, что ген S-белка мог достаться SARS-CoV-2 от коронавируса яванского панголина. Но когда ученые сравнили последовательности S-белка у разных вирусов и построили для них филогенетическое дерево, они не увидели там следов недавней рекомбинации. А значит, если она и была, то давным-давно — то есть получил этот участок общий предок SARS-CoV-2 и вируса панголинов. А обменивался генами этот предок с прадедом первого SARS-CoV.

Так версия о том, что кто-то целенаправленно вклеил в коронавирус летучей мыши участок гена от панголиньего вируса, оказалась пустышкой — участок похож, но не тот же самый, а его родословная теряется в прошлом.

Когда склейку найти не удалось, подозрения пали на фуриновый сайт — короткий участок в S-белке, который расщепляется протеазой фурином. Наличие этого участка делает коронавирус более патогенным. У ближайших родственников SARS-CoV-2 этого сайта нет — это позволило сторонникам лабораторной теории представить фуриновый сайт признаком вмешательства в геном вируса. Но уже тогда было известно, что подобные фуриновые сайты есть у многих других диких коронавирусов. И что они много раз возникали независимо — так что и SARS-CoV-2 вполне мог обзавестись фуриновым сайтом без посторонней помощи.

Теперь бдительные аналитики вирусных геномов придумали новый аргумент в пользу «лабораторности» коронавируса.

Что нашли теперь

Один из основных инструментов, которым орудуют генные инженеры, — рестриктазы (они же эндонуклеазы рестрикции). Это большая группа ферментов, которые выделены из бактерий и умеют расщеплять ДНК в строго определенном месте.

Каждая рестриктаза может связаться с ДНК только там, где видит конкретную короткую последовательность нуклеотидов (4–8 штук). Ее называют сайтом рестрикции. Рестриктаза садится на него и режет нить ДНК или в самом сайте, или сбоку от него. И режет так, что из двух цепей ДНК одна получается чуть длиннее. И вот этим концом подлиннее нить может приклеиться к какой-нибудь другой молекуле ДНК — если над ним поработала та же рестриктаза.

Молекулярные генетики используют рестриктазы, если им надо, например, вставить в цепочку новый кусочек или заменить один фрагмент на другой. При этом в каждом эксперименте обычно используют две разные эндонуклеазы: одна вносит разрез с одной стороны от гена, другая — с другой. После них остаются разные липкие концы, что помогает правильно соединить вырезанный ген с другими кусочками ДНК.

Если бы кто-то проводил генетические манипуляции с SARS-CoV-2, он бы наверняка тоже пользовался рестриктазами. Но эти ферменты, увы, не оставляют на ДНК никаких следов своей работы. Зато можно посмотреть на сайты рестрикции в геноме вируса.

Сами по себе сайты рестрикции нельзя считать признаком рукотворности организма. Они есть в любом геноме, поскольку бактерии защищаются от вирусов, вырезая из себя подозрительные последовательности — и используют для этого сотни разнообразных ферментов. Сейчас молекулярным биологам доступно более 800 разных рестриктаз, так что и в вашем геноме, и в геноме вашей кошки полно мест, которые могут распознать и разрезать какие-то из молекулярных ножниц. Но это не значит, что ваша кошка сбежала из лаборатории. И, тем более, вы.

Авторы нового препринта (то есть не прошедшей рецензирования научной статьи) заявили, что расположение сайтов рестрикции — которое они окрестили «эндонуклеазным фингерпринтом» — в геноме коронавируса якобы свидетельствует о том, что этот геном был отредактирован.

Вообще этот термин в молекулярной генетике уже есть, но означает совсем другое. «Эндонуклеазным фингерпринтингом» называют метод, при котором наличие или отсутствие сайтов рестрикции помогает заметить мутации в ДНК организмов (вот примеры: один, другой). Ничего общего с биоинформатическим анализом генома и поиском следов «искусственности» этот метод не имеет. Судя по всему, авторы работы либо придумали новый термин, либо не совсем корректно использовали старый.

Так или иначе, они подсчитали, что сайты для одной конкретной пары эндонуклеаз (BsaI/BsmBI) в геноме нового коронавируса расположены «регулярнее», чем можно было бы ожидать, исходя из статистики по другим коронавирусам.

По мнению авторов, молекулярные генетики, создавая новый вирус, обязательно оперировали бы относительно короткими участками ДНК — и места разрезания рестриктаз распределились бы более равномерно, чем у «диких» вирусов.

Исследователи построили зависимость длины самого большого интервала между сайтами рестрикции от общего числа таких интервалов. Получилось, что по этому параметру SARS-CoV-2 действительно выбивается из общей массы. Всего на нем нашлось пять сайтов для BsaI/BsmBI, которые делят геном нового коронавируса на примерно равные участки — которые, по подсчетам авторов статьи, получаются подозрительно короткими.

На фоне других коронавирусов SARS-CoV-2, действительно, выделяется. Но прежде чем делать из этого далеко идущие выводы, хорошо бы убедиться в том, что аномалия действительно значима. И здесь к методологии статьи возникают вопросы.

Подозрительная аккуратность

Прежде всего: почему именно BsaI/BsmBI? В арсенале молекулярных биологов — больше 800 рестриктаз. Выбор конкретного инструмента зависит от того, где именно вам надо разрезать и склеить геном, какие гены в него встроить. Непонятно, почему стоит обратить внимание именно на эти два фермента. Более того, если посмотреть на какую-нибудь другую пару, велика возможность увидеть совсем другую картину.

Представьте, что у вас в руках пять монет и вы подбрасываете их несколько сотен раз. Вероятно, однажды они образуют какую-нибудь узнаваемую фигуру: например, четыре из них упадут прямоугольником, а пятая ляжет где-нибудь в его центре. И вы не будете воспринимать это как аномалию — вы просто сделали много попыток.

Каждая пара рестриктаз — это тоже «попытка», которая могла бы дать совсем другое расположение сайтов рестрикции. Но авторы работы почему-то все свое внимание посвятили именно той, что дает аномально аккуратную картину. Такая статистическая ошибка называется выборочным представлением данных, или cherry picking. Кстати, на этом неоднократно попадались дениалисты и конспирологи всех мастей, от креационистов до отрицателей изменения климата: первые хватались за точечные аномалии геологических слоев, вторые — за кратковременные изменения в тенденциях среднегодовой температуры.

Но даже если допустить, что эта аномалия статистически значима, доказывает ли она лабораторное происхождение коронавируса? Это могло бы быть так, если бы гипотетические авторы занимались созданием вируса с аккуратным геномом. Но злонамеренные биологи вели бы себя иначе и стремились бы увеличить вирулентность. Для этого пришлось бы тасовать гены или менять их важные участки — а гены во всех организмах расположены без особой регулярности, что довольно некрасиво. И к тому же имеют разную длину. А важные для вирулентности участки и вовсе могут быть весьма короткими, так что равномерно их разложить по геному проблематично.

В итоге распределение сайтов рестрикции у рукотворного вируса может быть разным, в зависимости от длины и количества вставленных в него участков ДНК — и вовсе не обязано выглядеть аккуратно. Поэтому многие ученые считают, что искать аккуратно расположенные сайты рестрикции для доказательства лабораторного вмешательства бесполезно. Профессор Бенджамин Нойман из Техасского университета A&M даже сравнивает такого рода поиски с нумерологией: «Это как если бы вы конвертировали последовательность генома в цифры, нашли сумму этих цифр и сравнили ее с числом Зверя».

Наконец: уверены ли авторы работы в том, что другие вирусы не несут в своем геноме подобных аномалий? Судя по графикам из препринта, некоторые природные коронавирусы, которые у самих авторов вне подозрений, оказались по той же самой метрике еще в большей степени «искусственными», чем SARS-CoV-2. Тогда, по-хорошему, нужно было поднять вопрос и об их происхождении (однако, при этом придется решить сложный вопрос об отрезных точках: после какого значения считать вирус искусственным?).

К тому же, все пять подозрительных сайтов рестрикции имеют гомологи в эволюционно родственных коронавирусах. «Если пытаться восстанавливать общего предка SARS-CoV-2 и [его] ближайших родственников (чего они, кажется, не делали в исходной работе), получается, что у него тоже были все пять сайтов», — говорит в беседе с N + 1 эволюционный вирусолог из Сколтеха Георгий Базыкин. А значит, своими аккуратно расположенными сайтами рестрикции коронавирус тоже мог обзавестись без посторонней помощи, просто унаследовав их от своего предка.

Итого

Авторы препринта возрождают гипотезу склейки в новом обличье — только ищут в геноме вируса не вклеенные детали, а места, куда их можно было бы поместить. Но при этом не объясняют, что, собственно, было склеено.

Искусственно собранные геномы можно опознать филогенетически — разные участки оказываются происходящими от разных вирусов. Причем, скорее всего, генные инженеры взяли бы какие-нибудь известные вирусы, и совпадение отдельных участков искусственного вируса с ними было бы стопроцентным.

Но почти все участки генома SARS-CoV-2 обнаруживают максимальную (хотя не полную!) идентичность с одним и тем же коронавирусом летучих мышей, RaTG13. Исключение составляет уже упоминавшийся связывающий участок S-белка, где как раз могла произойти рекомбинация. Но авторы препринта не ищут никаких следов редактирования в этой спорной области, вместо этого акцентируя внимание на равномерности расположения сайтов рестрикции по всему геному. «В целом я думаю, что эволюционные аргументы тоже против исходной работы», — резюмирует Базыкин.

Этот препринт, как и многие другие, вызвал легкий переполох в научном сообществе — другие вирусологи принялись пересчитывать и перепроверять его результаты. Но и он, скорее всего, разделит судьбу своих конспирологических предшественников — и не будет принят к публикации ни одним престижным журналом. Так ранее произошло, например, с нашумевшим препринтом о вставках в геноме нового коронавируса, якобы происходящих из ВИЧ-1. После споров и проверок авторы даже сами отозвали его с bioRxiv. Новый препринт пока на месте — но научное сообщество уже вынесло свой вердикт. Как выразился микробиолог Алекс Критс-Кристоф: «В науке много вещей, про которые мы говорим „неправильно“, но этот препринт — просто Заблуждение».

А попытки найти что-нибудь подозрительное в коронавирусном геноме на этом наверняка не закончатся. Будут и новые работы — и можно начинать гадать, на чем будет строиться следующая теория о рукотворном коронавирусе. Мы уже морально готовимся ее разбирать. Оставайтесь на линии!