Геном человека: двадцать лет спустя

Что на самом деле произошло, когда «расшифровали геном человека» — и происходит сейчас

20 лет назад президент США Билл Клинтон и премьер-министр Великобритании Тони Блэр объявили, что проект «Геном человека» и корпорация Celera Genomics завершили «первоначальное секвенирование генома человека». Говорят, что с этого момента биология вступила в «постгеномную эру». Назвать эту дату «днем расшифровки человеческого генома» можно, правда, только условно — на той конференции ученые лишь рассказали о первом «черновике» последовательности ДНК всех хромосом человека со множеством пробелов, некоторые из которых не заполнены до сих пор. Обе публикации, описывающие «черновик» человеческого генома, вышли в 2001 году, а «чистовая» версия появилась еще через три года. После этого проект «Геном человека» завершился — а вот расшифровка генома человека нет. Осмысление и дополнение полученных тогда данных продолжается до сих пор. N + 1 рассказывает о судьбе, пожалуй, важнейшего для науки XXI века проекта и том, что он сделал — и продолжает делать — с миром.

Генетический телескоп

Проект «Геном человека» иногда называют самой успешной международной научной коллаборацией в истории. Однако на старте единодушного оптимизма научное сообщество не испытывало: подготовку сопровождали публичные дискуссии и разгромные статьи, авторы которых утверждали, что прочитать последовательность человеческой ДНК невозможно, и деньги налогоплательщиков стоит потратить на что-то более полезное.

Хотя чисто техническая возможность секвенировать геном была показана еще в 70-х годах, когда был расшифрован первый геном вируса, о человеке задумались не сразу. По легенде, эта идея оформилась благодаря биологу Роберту Синшеймеру из Калифорнийского университета в Санта-Крус. Его коллеги-астрономы работали над созданием самого большого (на тот момент) наземного телескопа, и Синшеймер раздумывал над проектом подобного масштаба в биологии.

В 1985 году он собрал несколько ведущих генетиков для обсуждения проекта по секвенированию генома человека. Коллектив пришел к заключению, что идея заманчива, но не реализуема. К тому моменту не был расшифрован даже геном кишечной палочки размером «всего» в пять миллионов пар нуклеотидов, а максимальная продолжительность нуклеотидной последовательности, которую можно было прочитать за раз методом Сэнгера, составляла несколько сот нуклеотидов.

В обсуждении участвовал Уолтер Гилберт, который за 10 лет до того предложил свой метод секвенирования ДНК (известный как метод Максама-Гилберта или метод химической деградации ДНК), практически одновременно с Фредериком Сэнгером. Он загорелся идеей создания геномного института и увлек ей первооткрывателя структуры ДНК Джеймса Уотсона и Чарльза Делиси, который возглавлял подразделение здоровья и окружающей среды в Министерстве энергетики США. Последнему геномный проект виделся логичным продолжением исследований влияния радиации на человека. В 1986 году они уже подсчитывали затраты на расшифровку последовательности генома человека.

Настроенные скептически коллеги оценивали продолжительность проекта в десятки лет рутинной работы, если «читать» ДНК небольшими научными коллективами — а ведь только в этом случае, по их мнению, работу можно сделать хорошо. Объем предстоящей работы казался невероятно огромным: один из столпов молекулярной биологии Сидни Бреннер шутил, что секвенировать ДНК будут заставлять преступников, причем размер хромосомы будет прямо пропорционален тяжести преступления. Однако Уотсон и Делиси решили сделать ставку на крупные автоматизированные центры и международное сотрудничество. Финальный план американской части проекта был рассчитан на 15 лет и три миллиарда долларов.

Эта цифра кажется большой — но, к примеру, космический проект «Аполлон», реализованный двадцатью годами ранее, стоил американцам в 10 раз дороже (без учета инфляции). При этом в результате выполнения проекта «Геном человека» ученые обещали что-то не менее значимое, чем полет в космос — как минимум, разобраться в природе 4000 наследственных заболеваний и продвинуть вперед медицинскую генетику и сопутствующие технологии.

Несмотря на критику и ценник, им удалось продавить как Министерство энергетики, так и Национальные институты здоровья США (NIH). В 1990 году проект стартовал. Панель экспертов настоятельно порекомендовала кроме генома человека заняться также исследованием геномов модельных организмов: кишечной палочки, дрожжей, круглых червей и мыши — чтобы в случае успеха гены человека было с чем сравнивать.

«Заслуга запуска проекта, конечно, принадлежит Уотсону. И он изначально задумывался как международный. Во многих странах выделялось на это финансирование в рамках национальных проектов, — рассказывает Юрий Лебедев, заведующий лабораторией сравнительной и функциональной геномики ИБХ РАН и член Международной организации по изучению генома человека (HUGO), который в рамках проекта участвовал в создании карты 19-й хромосомы. — Люди из институтов США, Англии, Франции, Германии, Швеции, России — даже тех стран, которые не вошли в соавторы статьи в итоге — ездили друг к другу и работали над задачей сообща. В одиночку Америка бы конечно ничего не сделала».

В авторах статьи 2001 года были члены International Human Genome Sequencing Consortium из 20 научных групп США, Великобритании, Германии, Франции, Японии и Китая.

Почти одновременно со стартом проекта в США, советский академик Александр Баев смог убедить Горбачева выделить значительное финансирование на оборудование лабораторий и создание научных групп, которые могли бы участвовать в международном консорциуме по расшифровке генома человека. По воспоминаниям академика Льва Киселева, который в то время был председателем научного совета российской части программы, отечественный проект начинался очень активно — на его развитие было выделено около 20 миллионов долларов. Однако в 90-х годах государство уже не могло финансировать столь дорогостоящие фундаментальные исследования, и участие в консорциуме, хотя и не закрылось окончательно, было сокращено до минимума.

«У нас работой по проекту занимались несколько десятков групп. Многие из людей, которые работали тогда в проекте, сейчас возглавляют институты и лаборатории у нас и за рубежом», — вспоминает Лебедев.

Через несколько лет после старта одинокий марафон международного консорциума стал гонкой. Крейг Вентер, который изначально возглавлял одну из лабораторий в составе NIH, разработал новый способ исследования геномов под названием «expressed sequence tags», значительно ускоривший процесс поиска генов по их транскриптам. Вооружившись этой технологией и поддержкой венчурных инвесторов, он ушел из NIH и основал Институт геномных исследований.

В 1998 году Вентер объединился с производителем автоматических секвенаторов под вывеской Celera Genomics и объявил, что тоже займется расшифровкой генома человека. Начав на восемь лет позже, чем «Геном человека», Вентер собирался справиться с задачей всего за три года — в то время как международный консорциум не собирался финишировать раньше, чем через семь лет. Его компания планировала извлечь из этого немалую выгоду, запатентовав гены, связанные с наследственными заболеваниями (впрочем, в 2000 году Клинтон заявил, что последовательность генома является достоянием общественности, и патентовать ее нельзя, так что усилия бизнесмена в каком-то смысле оказались напрасными).

Появление конкурента подстегнуло «Геном человека», и цель в итоге была достигнута на два года раньше. Федеральный проект договорился с Celera, и результаты обоих проектов были одновременно объявлены на той самой пресс-конференции 26 июня 2001 года. В зале присутствовали и основатель «Генома человека» Джим Уотсон, и Джон Уайт, директор PE Corporations, спонсировавшей Вентера — лица обоих явно давали понять, что войну удалось закончить дурным миром. Статья группы Вентера вышла в Science, через день после публикации статьи «Генома человека» в Nature.

Предпосылки и последствия

В 80-е годы у генетиков уже были инструменты, позволяющие исследовать размер хромосом и расположение на них генов — в основном, при помощи ферментативного расщепления ДНК рестриктазами, разделения фрагментов в геле и гибридизации с радиоактивно меченой последовательностью. Взглянуть на ДНК более пристально удалось благодаря изобретению производительного метода секвенирования англичанином Фредериком Сэнгером, который до того уже придумал способ чтения аминокислотной последовательности белковых молекул.

Определение последовательности ДНК по Сэнгеру, в свою очередь, стало возможным благодаря открытию ДНК-полимеразы — фермента, который в клетке обеспечивает удвоение молекул ДНК за счет комплементарного достраивания цепи на одноцепочечной матрице.

Этот метод, в отличие от чисто химического метода Максама-Гилберта (деградация ДНК по участкам модификации определенных нуклеотидов), основан на ферментативной достройке второй цепи на матрице цепочки, которую необходимо прочитать, и поэтому более производителен. Синтез комплементарной цепи происходит с использованием стандартных нуклеотидов (A, T, G, C), но в определенный момент в пробирку добавляют радиоактивно меченый дидезоксинуклеотид, после встройки которых синтез цепи обрывается (сейчас для рутинного секвенирования используют тот же способ, но вместо радиометок используют флуоресцентные). Анализ в геле получившихся фрагментов разных размеров, оканчивающихся на одну и ту же «букву», позволяет восстановить всю нуклеотидную последовательность.

«Для того, чтобы получить представление о последовательности генома, важно было не только секвенирование, — уточняет Юрий Лебедев. — Нужно было составить физические карты хромосом с последовательностью генов, структурных и регуляторных участков. Это делалось путем клонирования в генетические вектора, дрожжевые, бактериальные и фаговые, перекрывающихся кусков генома размером десятки и сотни тысяч пар, и расставления на них известных генетических маркеров, по которым эти куски можно было сопоставлять. Нужно понимать, что к тому моменту ряд генов человека уже был клонирован с кДНК (ДНК, соответствующая матричной РНК после вырезания некодирующих участков — прим. N + 1) и отсеквенирован, так что мы могли использовать определенные последовательности для расставления „столбиков“, и параллельно искали новые маркеры. На это ушла значительная часть времени. Вентер поступил хитро — он использовал уже готовые физические карты, и только наложил на них сиквенсы, и ему, конечно, понадобилось гораздо меньше времени».

Надо пояснить, что все полученные данные по ходу дела выкладывались в открытый доступ, в том числе и карты хромосом с расположением на них генов. Это значительно упростило задачу Крейгу Вентеру, который использовал их для картирования последовательностей, полученных модифицированным «методом дробовика».

«Для секвенирования дробили каждый из больших фрагментов на смесь перекрывающихся фрагментов меньшей длины, переклонировали мелкие фрагменты в фаговый вектор (М13) и секвенировали по Сэнгеру на автоматических секвенаторах всю смесь мелких фрагментов», — поясняет Лебедев.

Собственно, метод разбивки на короткие фрагменты и называется «методом дробовика». Первая длинная последовательность ДНК, прочитанная таким образом в 1981 году — геном вируса мозаики цветной капусты. Вентер понял, что короткие кусочки генома необязательно клонировать в вектора, а можно читать с двух сторон прямо так (для этого к ним нужно пришить с краев известные последовательности). Благодаря этому усовершенствованию его команда быстро прочитала последовательность 70 миллионов кусочков, и собрала их воедино при помощи уже готовых физических карт за три года. Стоило это им всего 200 тысяч долларов — несравнимо меньше, чем «Геному человека».

К моменту запуска проекта в 1990 году было расшифровано несколько коротких вирусных геномов и плазмид (вспомогательных кольцевых молекул ДНК из бактерий), размер которых ограничивался десятками тысяч пар нуклеотидов. «Геном человека» же собирался прочитать геном размером на несколько порядков больше: три миллиарда пар — именно столько «букв» содержит одинарный набор хромосом человека (23 хромосомы). По мнению большинства, число генов, содержащихся в этой «летописи», должно было составить около 100 тысяч.

Неудивительно, что многим ведущим генетикам эта задача казалась нерешаемой. Однако по ходу выполнения проекта развитие технологий облегчило ученым работу. Среди технических достижений можно отметить появление автоматического капиллярного секвенатора, где фрагменты разделялись в тонких трубочках, а не в геле. Такие приборы, помимо того, что позволяли увеличить количество образцов, после появления флуоресцентно меченых нуклеотидов, перешли на автоматическую детекцию сигнала. Кроме того, развитие компьютерных технологий: от сетей, которые позволили ученым получать доступ к данным из любой точки, до программ для сравнения и обработки последовательностей.

Накопление последовательностей послужило толчком для развития целой науки — биоинформатики, которая занимается сборкой, обработкой и анализом геномов с использованием математических методов.

«Высокопроизводительное секвенирование (NGS) появилось именно по итогам секвенирования генома человека — до этого просто не было необходимости читать столько последовательностей. Более того, я уверен, что этот проект подстегнул развитие и компьютерных технологий, и big data analysis — были огромные объемы данных, которые надо было как-то анализировать», комментирует результаты проекта Лебедев. В том же духе высказывается и биоинформатик, заместитель директора Института проблем передачи информации РАН Михаил Гельфанд: «Сейчас уже производительность секвенаторов растет быстрее, чем производительность процессоров и памяти. Данные растут быстрее, чем возможности по их обработке».

Первые итоги и дальнейшее развитие

Так к 2000 году удалось получить представление о последовательности ДНК человека в составе эухроматина — участков, с которых активно идет транскрипция, то есть считывание данных РНК-полимеразой.

По оценкам ученых, эухроматин составляет около 95 процентов всего генома. Остальная ДНК спрятана в плотно упакованных белковых комплексах и основную часть времени «молчит». Помимо человека, как и рекомендовали в 90-м году эксперты, к 2001 году были отсеквенированы геномы «599 вирусов и вироидов, 205 существующих в природе плазмид, 185 органелл, 31 эубактерии, семи архей, одного гриба, двух животных и одного растения», а к официальному финалу проекта список пополнился геномами мыши и крысы — модельных животных, без которых немыслимо ни одно крупное медицинское исследование.

Одной только сырой последовательностью букв результат проекта, конечно не ограничивается. После расшифровки число генов в геноме человека пришлось сократить со 100 тысяч до 30 тысяч — это число всего в два раза больше, чем у мухи или червя, написали авторы исторической публикации в Nature.

Также ученые узнали, что геном человека содержит очень много повторов и мобильных элементов, подавляющее большинство из которых уже не работает. Кроме того, геном человека очень разнообразен — генетики оценили, что количество однонуклеотидных полиморфизмов в нем (участков, в которых у разных людей может стоять тот или иной нуклеотид) достигает 1,5 миллионов. Это стало ясно в том числе благодаря тому, что в проекте была использована ДНК от большого количества добровольцев, а не от одного человека.

«Есть масса вещей, про которые не подозревали, что они в принципе бывают. Вот вы жили где-то на берегу и думали, что живете на маленьком острове. Потом как-то забрались на гору, туман рассеялся, и вы увидели, что на самом деле это целый континент», — описывает научные итоги проекта Михаил Гельфанд, лаборатория которого участвовала в сборке и анализе генома человека.

Однако геномные исследования с выходом первой геномной статьи только начались. Гельфанд приводит примеры: «Вслед за проектом „Геном человека“ был, например, проект ENCODE, в которым люди уже целенаправленно изучали именно функциональные вещи. Не просто выписать последовательность букв, а понять: почему ткани разные, почему гены работают по-разному в разных тканях. Опять-таки, как устроено раковое перерождение, как гены начинают по-другому работать, как устроена, как меняется работа гена в ходе раннего развития, когда из одного типа клеток возникает много разных тканей. Как ДНК упакована в клетки и на что это влияет. Есть масса технологий, которые сообщают нам именно функциональные вещи, но они в очень значительной степени привязаны к секвенированию генома. Вы что-то секвенируете, потом картируете геном, а потом из этого делаете какие-то функциональные выводы. Фактически с этого началась наука, которая называется системная биология, когда вы пытаетесь понять не по одному как гены работают, а как работает клетка в целом, но при этом с очень большой детальностью. И это вещь, которая без генома была бы в принципе невозможна. Опять-таки наш уровень понимания того, как клетка устроена, он принципиально изменился. Мы не просто как слепые слона с разных сторон щупаем, а мы теперь смотрим на целого слона, причем насквозь».

«Стандартный», или референсный геном человека дорабатывается до сих пор. «Финальная точка была очень условная. Договорились, что этот момент считать точкой, когда [Клинтон с Блэром] сделали [свое заявление]. В этот момент геном не был сделан до конца, люди потом много лет дочищали это дело, — рассказывает Гельфанд. — Сейчас выходят чудесные работы, из которых следует, что если взять много-много геномов разных людей, то там будут целые куски, которых в классическом геноме нет, то есть мы отличаемся не только точечными мутациями и заменами, но и целыми большими кусками генома, которые у кого-то есть, а у кого-то нету. В прошлом году вышла статья, они несколько процентов добавили к универсальному геному человека, просто секвенировав много африканцев».

Геном для медицины

За двадцать лет с момента завершения сборки черновой версии генома технологии секвенирования и анализа последовательностей развились настолько, что сегодня узнать последовательность кодирующих участков генома (экзома) обойдется вам уже не в три миллиарда долларов, а лишь несколько сотен.

Исследовательские базы данных продолжают пополняться — этим занимается, например, проект «Тысяча геномов», который призван оценить генетическое разнообразие жителей планеты. Создаются национальные банки ДНК. К примеру, исландская компания deCODE genetics владеет генетической информацией двух третей населения Исландии. Эти данные в том числе используются для развития персонализированной медицины — индивидуального назначения терапии на основании генетических данных пациента.

Генотипирование, то есть определение однонуклеотидных полиморфизмов конкретного человека, уже во многом стало рутиной — в базе данных UK Biobank хранятся данные полногеномного типирования 500 тысяч человек. Кроме генетических данных, записи участников содержат информацию о показателях здоровья, привычках, семейных историях болезни и т.п. Такие наборы данных позволяют исследователям проводить так называемые полногеномные анализы ассоциаций (GWAS — Genome-Wide Association Study), которые позволяют выявить, например, генетическую предрасположенность к определенному заболеванию.

«Геномные исследования могут показать, что у носителей такого варианта гена заболевание встречается, к примеру, в пять раз чаще, чем у носителей другого варианта. Это знание может помочь скорректировать образ жизни так, чтобы минимизировать вероятность. Но вычисление рисков развития заболевания полностью опирается на статистику, здесь еще есть куда развивать математический аппарат, — говорит Лебедев. — Что касается предсказания способностей к спорту и музыке по геному ребенка, это, конечно, вещь из области фантастики. Однако, секвенирование генома или экзома может помочь родить здоровых детей в том случае, если родители являются носителями каких-то вредных мутаций».

В последние годы секвенирование и генотипирование ДНК активно применяется в онкологии (об этом мы уже подробно рассказывали в материале «С индивидуальным наведением»). Помимо назначения терапии в зависимости от наличия тех или иных мутаций в опухоли, онкогеномика помогает понять природу возникновения опухолей и их метастазирования. «Очень много вещей в медицинской генетике, в онкологии, иммунологии тоже завязано на геномы. Сейчас люди начали смотреть уже геномы индивидуальных клеток, это позволяет, например, засечь развитие рака. Раковая опухоль неоднородна, в ней много разных клонов, и это очень важно для лечения. В ней есть клоны устойчивые и неустойчивые к какому-либо лечению. Которые могут дать метастаз, и те, кто недостаточно злокачественные, чтобы метастазировать. И теперь первые работы такого сорта появляются, когда люди просто делают генеалогию индивидуальных клеток в раковой опухоли», — поясняет Гельфанд.

«При помощи современных постгеномных технологий можно посмотреть, сколько клеток в организме человека заражено SARS-CoV-2, — приводит злободневный пример Лебедев, лаборатория которого в настоящее время занимается изучением субпопуляций иммунных клеток человека. — И можно понять, это клетки убитые, погибающие или борющиеся, как развивается иммунный ответ. С использованием как секвенирования, так и других методов, например, многопараметрической флуоресцентной гибридизации (FISH) можно посчитать в образце крови больного, сколько там цитотоксических лимфоцитов, сколько хэлперных, сколько антител-продуцирующих, сколько из них уже перешли в клетки памяти».

20 лет спустя

Когда Френсиса Коллинза, который в 1993-м сменил Уотсона на посту руководителя американской программы «Геном человека», в 2000 году спросили о перспективах геномных исследований, он предположил, что к 2020 году будет повсеместно распространено генетическое тестирование, появится генная терапия для наследственных заболеваний, а генотерапия на уровне зародышевых клеток докажет свою безопасность. Как показало время, он почти оказался прав — и генотерапия, и редактирование эмбрионов уже существуют, но их повсеместному применению препятствуют совсем другие вещи — вопросы безопасности, эффективности, этики, да и вопросы целесообразности (зачем редактировать эмбрион, если можно отобрать здоровый на стадии ЭКО?).

«В Америке все боятся, что геномная информация приведет к дискриминации отдельных работников страховыми компаниями. То есть, если у тебя склонность к развитию болезни в пять раз выше, то и плати в пять раз больше. Но это же проблема страховых, а не генетики, — указывает Лебедев. — Я не думаю, что законодательное регулирование сейчас как-то ограничивает развитие генетических технологий в отношении человека. Вот где дело касается генно-модифицированных растений, там да, законы мешают развитию отрасли».

«Да, счастье пока не наступило. Но если бы счастье не обещали, то денег бы никто не дал, — делится соображениями по поводу перспектив геномики Михаил Гельфанд. Это окупается, просто медленнее и не так ощутимо. В биологических вещах дольше путь от понимания к использованию. На самом деле очень сильно продвинулась медицина, мы просто этого не замечаем».

У Юрия Лебедева несколько иная точка зрения: «Уже сегодня в соседнем институте подбирают терапию детских лейкозов, основываясь на генетической информации пациентов. А режим лечения для больных болезнью Бехтерева (аутоиммунное заболевание) регулируют исходя из данных UK Biobank. Это и есть персонализированная терапия — я не ожидал, что это будет доступно так скоро».

Дарья Спасская

Нашли опечатку? Выделите фрагмент и нажмите Ctrl+Enter.
Корень резуховидки отличил верх от низа благодаря белку LAZY

Для этого растению понадобилось 15 минут