Что такое минимальный геном и как он продвигает нас к созданию синтетической жизни
В 2010 году команда биологов под руководством Крейга Вентера — того самого, что прочитал геном человека быстрее, чем одноименный международный консорциум — отчиталась о создании «первого полностью синтетического организма». Суть той работы сводилась к тому, чтобы химически синтезировать геном бактерии Mycoplasma mycoides и загрузить его — примерно как новую прошивку в компьютер — в другую клетку. Сегодня та же команда рассказала о следующем шаге к созданию «дизайнерской жизни». Ученым удалось удалить из версии 1.0 все ненужное и вырастить новый организм с полностью самодостаточным и при этом минимальным геномом. О том, как это было сделано и что означает новая работа для науки, мы поговорили с известным российским биоинформатиком, заместителем директора ИППИ РАН профессором Михаилом Гельфандом.
Крейг Вентер фигура в биологии столь же одиозная, сколь и легендарная. Для читателя, незнакомого с его биографией, можно смело посоветовать уже старую, но неплохую книгу «Геномная война». В ней подробно описывается история, благодаря которой наш герой стал знаменит, история о том, как Вентер обогнал все мировое научное сообщество и прочитал геном человека быстрее и дешевле академических ученых. Не из особой любви к человечеству: вообще-то план был в том, что бы побыстрее запатентовать гены и получать с них прибыль. Тут, к счасть, все произошло в точности по Гёте: вместо патентов на чужую ДНК Вентер получил лишь известность и прозвище «Дарт Вентер». Человечеcтво же обрело новую технологию секвенирования геномов («метод дробовика»), которая до сих пор остается стандартом в своей области.
Но это все дела минувших дней. На протяжении последних 15 лет Вентер и команда возглавляемого им института (естественно, Института имени Вентера) работают над созданием «синтетической жизни». Что это такое? Сразу следует оговорится, что под всеми заголовками, обыгрывающими «игру в Бога» или создании «искусственной жизни» на самом деле речь идет о гораздо более прозаических вещах, чем это может показаться на первый взгляд. Ни Вентер, ни кто-либо другой из ученых не может и не собирается создавать какие-то принципиально новые организмы из принципиально иных компонентов, чем те, что есть в любой клетке Земле. Речь не идет о создании какой-то гипотетической «кремниевой», «мышьяковой» или цифровой жизни.
В реальной синтетической биологии 2016 года можно условно выделить три главных направления. Во-первых, это создание и моделирование искусственных генетических конструкций, которые могли бы стать элементарными компонентами будущих больших систем (например, как здесь). Они должны стать приблизительными аналогами диодов, переключателей или конденсаторов в электронике — то есть набором простых и предсказуемых компонентов, которые можно внедрять в ГМ-организмы и использовать те для создания вакцин, синтетического топлива и так далее. В целом это все та же генетическая инженерия, только гораздо дальше ушедшая от природных компонентов, чем в 70-е и 80-е. Немного другое направление, ксенобиология, это введение в обычные модельные организмы искусственных компонентов. Например, превращение одного из стоп-кодонов в генетическом коде в триплет, кодирующий новую, не встречающуюся в природе аминокислоту. Это не только расширяет спектр того, что можно вставить в белок, но и привязывает организм к лаборатории, из которой он уже не может сбежать — ведь снаружи нет тех искусственных аминокислот, что ему нужны для жизни. Это очень важно для создания штаммов, синтезирующих что-то потенциально опасное для окружающей среды. Или, например, работа, в которой ученые создали две дополнительные искусственные буквы для нуклеиновых кислот — основания, которых нет в природе. Они могут найти множество применений в биотехнологии, которые сейчас трудно предсказать.
Третье направление, которым сейчас занимаются только Вентер и его коллеги — это химический синтез полных геномов. Это в некотором роде подход «сверху вниз», то есть не сборка нового организма из простых и понятных синтетических элементов (их пока единицы), а создание полного генома целиком и сразу. Пусть даже и без детального анализа того, что в него входит: сначала сделаем — потом разберемся.
Здесь на передний план выступает не глубокий анализ или изящная идея, а простая в формулировке, но при этом очень тяжелая задача: синтезировать очень большую молекулу ДНК и не допустить при этом ошибок. Это задача, с которой до Вентера мало кто сталкивался. Сейчас химический синтез фрагментов ДНК длиной 50-70 оснований делается очень просто; происходит это на автоматических машинах-синтезаторах, в одной Москве их наберется несколько десятков штук. Но если вам нужна ДНК длиной в сотни и тысячи оснований — задача сразу же становится нетривиальной и требует многостадийной сборки фрагментов вручную. Если же речь идет ДНК длиной в сотни тысяч нуклеотидов (а в геноме Mycoplasma чуть больше миллиона оснований) то нужен переход на другие модельные организмы и разработка новых молекулярно-биологических методов. Кроме того, по мере роста длины синтезируемой ДНК быстро растет вероятность внесения ошибки, а значит нужно придумать эффективную систему их поиска и исправлений. А это, как показал опыт, может быть непросто.
Первым успехом группы Вентера в этом направлении стал синтез генома бактериофага φX174. Этот вирус, кстати, был выбран неслучайно — около десяти лет до того он стал первым организмом с полностью прочитанным геномом. Длина этого генома всего 5386 оснований, но для 2003 года это все равно было большим достижением. Затем той же командой были созданы методы трансплантации генома, позволяющие ввести в клетку целиком новый геном и затем разрушить геном старый. В компьютерной аналогии это сродни установке нового софта на старом железе. Отличие биологических систем в том, что тут новый софт сам постепенно строит для себя новое железо: у бактерией с «подмененным» геномом меняется состав РНК, белков, липидов мембраны — вообще почти всего, что есть в клетке. Усилия Вентера и его коллег увенчались в конце концов статьей 2010 года, в которой описывается создание первого живого организма с синтетическим геномом — Mycoplasma mycoides JCVI-syn1.0.
Геном этого организма был практически идентичен геному природной микоплазмы за исключением небольшого числа генов-маркеров и «цифровых подписей» авторов статьи. Однако, несмотря на впечатляющие технические достижения, которыми сопровождалась эта работа, она неизбежно вызывает простой вопрос — «зачем нужно искусственно фабриковать Спиноз, когда любая баба может его родить когда угодно»? Зачем делать бактерию с искусственным геномом, если он почти ничем не отличается от природного? Сама по себе работа 2010 года была бы лишена смысла, если бы за ней не последовало то самое продолжение, которое было опубликовано сейчас.
Идея, которая стоит за всем этим циклом работ, заключается в том, что рано или поздно биологи должны уйти от чисто описательного понимания жизни и научится создавать новые, «дизайнерские» организмы. До некоторой степени это происходит уже сейчас, вспомним хотя бы о ГМО. Но там речь идет только о точечных, специально введенных функциях, фактически же организм остается тем же самым, каким сделала его эволюция. Но у эволюции были свои задачи, наложившие на геном свой исторический отпечаток, — нам же это ни к чему.
Что, если выкинуть из модельного организма, например простой бактерии, всё, что не абсолютно необходимо ей для воспроизводства? Тогда, добавляя ту или иную готовую конструкцию, мы сможем получить из нее организм, который идеально справляется с одной конкретной задачей. Например, с производством нужного антибиотика или лекарственного белка. Или с созданием синтетического топлива, — одна и самых любимых для Вентера тем. Чем система меньше, тем она должна быть более предсказуема, а значит добиться полного контроля над организмом можно только тогда, когда мы минимизируем его геном. Так это или нет — пока неизвестно. Многие исследователи скептически относятся к самой идее о том, что самым эффективным и предсказуемым обязательно будет организм с минимальным геномом. Но так или иначе, именно эта логике лежит в основе всей идеи химического синтеза геномов, как ее понимает команда Вентера. Поэтому задача минимизации была поставлена сразу же, как только удалось разработать пайплайн синтеза геномов.
Как реально проводилась минимизация генома в ходе новой работы? Двумя путями. Во-первых, у ученых была система мутагенеза с помощью транспозонов, разработанная, кстати, той же командой еще в 1999 году. Она позволяет выключить один ген в одном организме, а потом посмотреть, что из этого получилось. Если отсеквенировать геномы тысяч колоний, где произошли такие мутации, то можно будет составить карту генома и узнать, куда транспозоны никогда не попадают.
Это как со знаменитой ошибкой выжившего: если после налетов бомбардировщики возвращаются с дырами в крыльях и хвосте, но никогда не имеют повреждений в районе кабины и бензобака, то это не значит, что в бензобак и кабину не попадают пули. Это значит, что когда туда они попадают, такой самолет уже не возвращается на базу. Тот же самый подход и работает и с геномом: если при случайном мутагенезе вы никогда не видите мутаций в некотором гене, значит этот ген скорее всего необходим клетке для выживания. Помимо мутагенеза транспозонами, команда Вентера имела систему, которая позволяла проверять выживаемость крупных кусков генома бактерии. Например, можно было удалить какие-то гены целыми кассетами и проверить, как это скажется на выживании организма. Раньше эта система использовалась для контроля случайных мутаций в геноме, сейчас ее приспособили для их преднамеренного введения.
Что же мы имеем в итоге, что же за организм в итоге удалось сейчас получить? Во-первых, геном микоплазмы удалось ужать почти вдвое: его длина составляет 531 тысячу оснований против 1079 тысяч исходной Mycoplasma mycoides JCVI-syn1.0. В нем присутствуют 473 гена, в том числе несколько генов регуляторных РНК. Во-вторых, штамм syn3.0 делится почти втрое медленнее природной микоплазмы и имеет довольно беспорядочную морфологию клеток: они сильно отличаются по размеру и могут образовывать филаменты.
В-четвертых, получены данные о составе минимального генома. В нем около 40 процентов генов отвечают за экспрессию генетической информации — синтез РНК и белков, 7 процентов — это гены воспроизводства информации, системы репликации и репарации мутаций. 18 процентов генов отвечают за поддержание структуры мембраны и примерно столько же занимаются метаболизмом. Самое интересное заключается в том, что 149 из 473 генов не имеют однозначно показанной функции. Часть из них похожа на какие-то известные классы белков, но почти 17 процентов не имеют определенной известной функции даже в самом общем смысле.
С одной стороны — это довольно необычный результат, о чем многократно говорил сам Вентер на телеконференции для журналистов. Странно видеть треть генов с неизвестной функцией в минимальном геноме. С другой стороны, у специалистов он не вызывает удивление, многие из них предсказывали, что минимальный геном обязательно будет содержать гены с неизвестной функцией. Хотя бы потому, что наше понимание геномной Вселенной очень далеко от полноты. Доля таких генов — почти треть — может быть и необычна, но только не сам факт их наличия. О том, что еще интересного удалось обнаружить минимальном геноме syn3.0 мы попросили рассказать Михаила Гельфанда, одного из главных российских специалистов по геномике микроогранизмов.
«N+1»: Есть ли среди полученных генов что-то неожиданное?
М.Г.: Там есть несколько генов, про которые не вполне понятно — почему они являются столь уж обязательными. Например, есть некоторое количество экспортеров, которые выбрасывают что-то из клетки, и не ясно, почему это столь уж важно.
Кроме того, в геноме syn3.0 более сотни генов с неизвестными функциями. То есть в каком смысле неизвестными? Для части из них понятно, какой тип химической реакции катализирует фермент, кодируемый таким геном. Но при этом не ясна ни его специфичность (с какими именно веществами он работает), ни биологический контекст — в какой ситуации данный фермент «включается». И это интересно, потому что показывает, что биохимию клетки мы понимаем не настолько хорошо, как нам бы хотелось.
Среди этих генов с неизвестными функциями много довольно консервативных, сохраняющихся вплоть до человека. Понятно, что если они настолько старые, то, наверное, и довольно важные. И наоборот — есть необходимые гены, специфичные для микоплазм, то есть, видимо, эволюционно довольно молодые. Было бы интересно попробовать понять их эволюционную историю.
Другая вещь, которая может быть интересна, но в статье не отражена, — это состав тех генов, которые все-таки удалось из минимального генома выкинуть. Какова среди них доля тех, что сохранены вплоть до человека? Это интересно было бы посмотреть, ведь консервативность обычно говорит о важности гена, и если какой-то ген консервативен, но при этом его нет в минимальном геноме, — было бы интересно узнать, почему. Ну то есть понятно, что этот syn3.0 живет в райских условиях, ему не нужно уметь многое из того, что требуется клеткам в природных условиях. Но, тем не менее, это может быть поучительно.
В статье Кунина и Мушегяна, где впервые выдвигается концепция минимального генома, этот теоретически минимальный геном оказался почти вдвое меньше, чем в реальном syn3.0. Так что же, они были неправы?
М.Г.:Это классическая история о том, как красивая интересная идея сталкивается с уродливой биологической действительностью. Это как универсальный генетический код — прекрасная таблица, которая приводится в любом учебнике биологии. Про которую все-таки полезно понимать, что есть организмы, у которых генетический код отличается от «универсального».
Одна из причин различия между предсказанным и экспериментально работающим набором — это то, что одну и ту же функцию могут выполнять совершенно неродственные белки. И Кунин с Мушегяном это, конечно, прекрасно понимали. Если одну и ту же жизненно важную функцию у Mycoplasma выполняет один белок, а у Haemophilus — другой, то вы не сможете узнать, что хотя бы кто-то из них нужен в минимальном наборе. Сравнивая два генома, это просто невозможно установить.
Из этого наблюдения, вообще, уже выросло целое направление исследований. Кунин назвал это явление неортологическим замещением — когда функцию гена в геноме перехватывает другой, неродственный ген, например, привнесенный в результате горизонтального переноса. Если мы ищем такие гены, можно смотреть на их распределение по геномам разных организмов. Например, если пара генов действительно являются «дублерами» друг друга, то они должны реже встречаться вместе в одном геноме (это просто избыточно), так что по анализу распределения можно такие пары генов ловить. У Мушегяна потом были такие работы.
Но, насколько я понимаю, в работе Вентера и компании такого рода анализ не был использован — они предпочти чистый экспериментальный «брутфорс»?
М.Г.: А это неизвестно, на самом деле. Они пишут, что, помимо данных по транспозонному мутагенезу, при отборе генов в минимальный набор дополнительно смотрели на их функции. И вот тут, мне кажется, все эти анализы вполне могут скрываться. Проблема в том, что подобный анализ плохо алгоритмизируется, его трудно описывать в разделе «Методы». Если вы не можете подробно расписать, как именно принималось решение, часто проще сказать, что оно было «сделано по экспертной оценке», вот и всё.
Что касается самого понятия «минимальность», есть две вещи, которые надо иметь виду. Во-первых, есть бактерии, у которых набор генов еще меньше, чем этот минимальный; их много изучает группа Нэнси Моран. Есть бактерия-эндосимбионт насекомых, у которой всего 121 ген (Tremblaya princeps). Например, в геноме syn3.0 остались все рибосомные белки. У этих же эндосимбионтов уже даже ультраконсервативные рибосомные белки начинают пропадать, меняется структура рибосомы, что вполне нетривиально (это уже наши пока неопубликованные данные). Конечно, жить свободно такие бактерии не могут.
Во-вторых, минимальный геном — это не абсолютное определение. Порог минимальности довольно условный, поскольку сильно зависит от скорости роста. Из генома syn3.0 можно было бы выкинуть еще парочку генов, но он тогда делился еще медленнее.
Красивый результат заключается в том, что обязательные и необязательные гены не перемешаны в геноме, а идут кластерами. Не то, чтобы это совершенно неожиданно — если бы мне предложили пари, я бы на это и поставил, что так должно быть. Но вот когда это реально показано — это забавно.
Если выбрать из этой статьи один главный результат, что это будет?
М.Г.:Там есть довольно маленькая научная составляющая и колоссальная технологическая. Если вы спросите, что изменилось в биологии после этой статьи — то я бы ответил, что, по большому счету, ничего. Есть, конечно, списки обязательных и необязательных генов, которые будет полезно разглядывать, но это не бог весть что. Однако технологически работа сделана, конечно, потрясающе.
Главный результат этой работы — это, конечно, вывод о том, что такое в принципе сделать можно. Это самое интересное. Все остальное — это или технические решения, или данные, из которых красивую биологию, наверно, можно будет извлечь, но авторы этим не озабочивались. Этот как с полетом на Луну — ну какие там были получены научные данные, наверное, не слишком сенсационные. Сенсация была в том, что такая задача в принципе может иметь инженерное решение. И это самое главное.
Беседовал Александр Ершов
Исследователи из Университета Лунда (Швеция) проанализировали эффективность методов сокращения выброса парниковых газов индивидуальными домохозяйствами, которые обычно рекомендуют официальные источники для снижения углеродного следа отдельным человеком. Оказалось, что большинство популярных рекомендаций касательно экологии, представленных в том числе в школьных учебниках, относительно неэффективны. Самыми действенными методами в борьбе с парниковыми газами оказались отказ от автомобиля, авиаперелетов, отказ от мяса и снижение количества детей в семье. Работа опубликована в журнале с открытым доступом Environmental Research Letters.