Путешествие к центру генома

Какой смысл нашли генетики в бессмысленных участках ДНК

Прообраз человека — это его гены, считали ученые, начиная проект по расшифровке человеческого генома. И когда выяснилось, что восемь процентов прочесть пока не получится, никто не расстроился. Все равно генов там не было — только бессодержательные участки, «мусорная ДНК». Собрать воедино и расшифровать их удалось только сейчас. Тут-то и оказалось, что они говорят о том, в чем гены давно запутались.

В 1879 году немецкий биолог Вальтер Флеминг вглядывался в препараты из семенников саламандры и брюшного жира новорожденных котят, чтобы понять, как размножается все живое. Он знал, что каждой живой клетке полагается ядро. Но заметил, что ядра размножаются не так, как клетка. У них не возникает перемычки, которая делит их на две половины, — вместо этого ядро-шарик превращается в хаотичный клубок из толстых нитей.

Флеминг понятия не имел, из чего сделаны эти волокна и зачем они нужны. Он звал их «хроматическими нитями», поскольку с ними связывались его красители, — а интересовало его, почему при каждом делении каждой дочерней клетке их достается поровну. Сегодня эти нити мы называем хромосомами.

Немец заметил, что за стадией клубка следует стадия звезды, на которой каждая нить сгибается пополам и своей вершиной тянется к центру клетки. После этого все они выстраиваются в одну шеренгу, а потом разворачиваются и симметрично расходятся к полюсам клетки. Флеминг предположил, что «хвосты» нити должны как-то отличаться от вершины, но дальше разбираться не стал — вместо этого взялся выяснять, одинаково ли хромосомы движутся у разных организмов.

К началу ХХI века генетики уже разобрались в том, что происходило на глазах у Флеминга. Они выяснили, что перед делением ядра хромосомы в нем удваиваются, — и потому, собственно, к полюсам расходятся два одинаковых набора. Область, в которой хромосомы сгибаются, ученые назвали центромерой и выяснили, что на ней образуется белковый нарост кинетохор, а за него хватаются моторные белки, чтобы растащить хромосомы по сторонам.

Но все еще не знали, что у центромеры внутри.


Незначительная ДНК

В 1986 году Министерство энергетики США (то самое, которое занималось Манхэттенским проектом) пригласило 43 генетика в Санта Фе, чтобы те подумали, возможно ли сейчас взять и целиком расшифровать ДНК человека. Ученые посовещались и признали задачу вполне достижимой. С одним нюансом. «Некоторые части хромосом могут не поддаваться секвенированию», — резюмировали родоначальники проекта «Геном человека» (подробнее о нем мы рассказывали в тексте «Геном человека: двадцать лет спустя»). Их смущало, что в человеческой ДНК много повторяющихся фрагментов (в сумме они занимают больше половины генома), с которыми не смогут работать ферменты рестриктазы, нарезающие ДНК для секвенирования.

Это, впрочем, никого не остановило, потому что нечитабельные куски генома в то время мало кого занимали. «Тогда все внимание было на генах», — вспоминает Иван Александров, старший научный сотрудник Института общей генетики РАН. Спросом в первую очередь пользовался эухроматин — активные участки хромосом, на которых идет синтез РНК. Они были «клинически интересными», на них можно было найти гены и связать их работу с конкретными болезнями.

В составе гетерохроматина (свернутой, неактивной части хромосом), конечно, тоже могут встречаться «вредные» участки — например, нередко в этих клубках сидят копии генных паразитов транспозонов. Но эта угроза обычно под контролем: свернутость участков не дает транспозонам высказаться, то есть размножиться и перепрыгнуть дальше.

Чаще эти последовательности, хоть и молчат, — в смысле, не производят белка — тоже заняты в полезном деле. Как теломеры — нашлепки на концах хромосом, тысячи повторов одного и того же «слова» ТТАГГГ. Оно ничего не значит, просто с каждым копированием хромосомы несколько десятков теломерных повторов идут под нож, а гены внутри хромосом остаются в целости и могут работать дальше.

Примерно так же — бессмысленным набором букв — выглядят и центромеры. Повторяются в них, правда, уже целые фразы длиной в несколько сотен нуклеотидов — и могут довольно сильно отличаться друг от друга. И это вторая (и главная) причина, по которой «Геном человека» не имел никакой возможности прочитать эти участки.

В то время для секвенирования использовали метод дробовика. Нужно было взять небольшой участок ДНК, сделать множество его копий, потом нарезать их с помощью рестриктаз на короткие кусочки и прочитать каждый по отдельности. Поскольку каждую копию рестриктазы дробят по-новому, то на выходе из одного фрагмента ДНК получается несколько разных коротких отрывков. Дальше в дело вступают биоинформатики: они ищут перекрывающиеся последовательности и, накладывая их друг на друга, восстанавливают полный текст.

В 1998 году Фрэнсис Коллинз сообщил: мы закончили составлять общую карту генома, дайте нам еще пять лет — и мы его расшифруем. Но прочесть генетический текст человека полностью уже не обещал: к 2003-му его подопечные рассчитывали явить миру 90 процентов человеческой ДНК. Остальные десять, вторил руководитель проекта «Геном человека» своим предшественникам из 1986-го, посмотреть не выйдет — для этого нужен технологический скачок.

Метод дробовика неплохо работал для уникальных последовательностей, из которых построены гены в эухроматине. Но перед повторами, которыми изобилует гетерохроматин, он бессилен, потому что рестриктазы пилят его на отрывки длиной около 200 нуклеотидов. А это 33 теломерных повтора (из нескольких тысяч) и чуть больше одного центромерного (из нескольких сотен или тысяч).

«Представьте, что у нас есть какая-нибудь газета, — объясняет биоинформатик Ольга Кунявская из СПбГУ, которая аннотирует центромеры сегодня. — Сто экземпляров. Их разрезали на мелкие кусочки, и порезали по-разному, и нам нужно восстановить все издание. А у нас есть участок в газете, где одно слово с мелкими опечатками повторяется 1500 раз. Понять, в каком порядке они идут [друг за другом], — это практически нереально. Можно алгоритмически доказать, что это невозможно сделать. Можно придумать несколько последовательностей, которые после секвенирования будут давать один и тот же датасет».

К тому же центромеры все еще считали генетически бессмысленными. «Обидно было, — рассказывает Александров. — Крик придумал в свое время эту „мусорную ДНК“, и [с тех пор] считалось, что повторы это какая-то ненужная ДНК, которая паразитически размножается сама собой. А [настоящая] центромера — это что-то вроде гена, который запрятан внутри этой мусорной ДНК. Еще в восьмидесятых годах стало ясно, что это не так, что все эти повторы — и есть центромера, но эта догма [о гене где-то в глубине мусорной ДНК] продержалась лет 15, примерно до начала 2000-х годов».

В 2001 году «Геном человека» опубликовал свой первый черновик. В 2003-м данные отшлифовали начисто и выпустили — хотя текст все равно был неполным. Ученые честно признались, что вообще не занимались гетерохроматином, поэтому часть последовательности осталась нерасшифрованной. Что, впрочем, не помешало им объявить о начале геномной эры в биологии.

Не все отнеслись к этому манифесту серьезно. Американские ученые Стивен Хеникофф и Хармит Малик ехидно отозвались, что ту часть хромосомы, которую впервые рассмотрело человечество в лице Виктора Флеминга, читать даже не начали. Да и сами «чтецы» соглашались, что пробелы хорошо бы закрыть — без этого невозможно точно сказать даже то, какой на самом деле длины наш геном. Но время новых технологий, на которые уповал Коллинз, еще не пришло.

Ручка от хромосомы

Вопрос о длине генома был не единственным, на который должно было ответить секвенирование гетерохроматина. И даже не главным. Например, было совершенно непонятно, как вообще работает увиденная Флемингом система перемещения хромосом во время деления. А точнее, как клетке удается схватить их строго за вершину.

Технические участки есть в любой линейной хромосоме и, как правило, у всех эукариот они очень похожи. Например, теломеры у всех животных устроены примерно одинаково, их повторы зачастую совпадают с точностью до буквы, отличается только количество (у мышей, например, теломерных повторов 7-8 тысяч, а у людей — как минимум в три раза меньше). Это неспроста: с техническими участками ДНК связываются технические же белки. Если эти участки будут слишком быстро мутировать, белки перестанут их распознавать. И если теломера изменится до неузнаваемости, хромосомы в ходе деления клеток начнут ломаться — а следом за ними и клетки.

Но центромеры, напротив, очень быстро мутируют. Даже у близких видов эти последовательности сильно отличаются. Флуоресцентные зонды, которые связываются с центромерами человека, никак не реагируют на центромеры шимпанзе (хотя с теломерами все получается). А число этих повторов может изменяться в разы: в клетках одного и того же человека у хромосом, полученных от матери и от отца, центромеры могут быть настолько разной длины, что это даже видно в микроскоп.

То, что центромеры оказались одновременно жизненно необходимой и очень изменчивой частью генома, Хеникофф и Малик назвали «центромерным парадоксом». Удивительно, что многообразная жизнь, которая использует центромеры для размножения своих клеток, все еще жизнеспособна. Если центромеры меняются слишком быстро, то есть риск, что белки кинетохора перестанут их узнавать и собираться в нужном месте, а значит и хромосомы начнут расходиться в дочерние клетки неравномерно. Это как перебирать работающий двигатель самолета посреди рейса — как это сделать, не свалившись в пике? И каким образом ему удается продолжать лететь? В смысле, клеткам животных (и самим животным) — размножаться?

Хеникофф и Малик также заметили, что никто толком не знает, как моторные белки определяют, за какое место тащить хромосому в новую клетку. Поначалу считалось, что это зависит от последовательности нуклеотидов: туда, где есть определенные фрагменты текста, налипает белок-упаковщик CENP-A. На него накручивается нить ДНК, и один центромерный повтор (171 пара нуклеотидов) как раз влезает ровно на одну катушку.

Но время от времени генетики сталкиваются с людьми, у которых CENP-A скручивает ДНК в неположенном месте. Такое происходит, например, если от хромосомы оторвался кусочек — но вместо того, чтобы потеряться при делении, стал еще одной хромосомой, 47-й. После этого он живет дальше: удваивается и передается от материнской клетки дочерним, как отдельная хромосома. Как, почему и в каком месте появляется такая неоцентромера, совершенно неясно. Как правило, это какой-то участок, где почти нет генов. Но там нет и центромерных повторов — и тем не менее, CENP-A все равно раз за разом туда садится. Значит, дело не только в тексте.

Тогда появилось подозрение, что центромера может быть не генетической сущностью, а чисто функциональной. И дело не в целевой последовательности, а контексте: просто вокруг места «приземления» CENP-A не должно быть ни генов, ни гистонов — белков, которые накручивают на себя остальную ДНК. Эти белки по строению похожи на CENP-A, но липнут к самым разным последовательностям нуклеотидов, не только центромерам. Почему в клетке вся ДНК наматывается на гистоны, а центромера — строго на CENP-A, толком неизвестно. Но поскольку центромера на каждой хромосоме должна быть только одна, то логично представить, что участки ДНК конкурируют между собой за право ей стать. И выигрывают те, на которых больше липких для CENP-A повторов.

Кроме того, Хеникофф и Малик предположили, что на этом поле друг с другом соперничают не только участки ДНК, но и одинаковые хромосомы. Это связано с тем, как у людей образуются женские половые клетки: предшественник яйцеклетки делится дважды, и только один из четырех его потомков станет яйцеклеткой. Соответственно, в каждом делении одну из двух копий хромосом утащат в будущую яйцеклетку, а другую — во вспомогательную клетку, то есть с точки зрения наследования — в никуда. А какая куда попадет, согласно гипотезе Хеникоффа и Малика, зависит от того, насколько прочно кинетохор (CENP-A и другие белки) закрепится на хромосоме.

Таким образом, центромера оказывается субъектом естественного отбора, который благоприятствует хромосоме с самым крепким кинетохором. Все остальные, в том числе гены — просто пассажиры. Поедут в следующее поколение, если их центромера победит. Каждая хромосома стремится сделать свою центромеру более липкой для CENP-A и именно поэтому, утверждали Хеникофф и Малик, центромеры так быстро мутируют.

В свою очередь, CENP-A тоже меняется. Он стремится стать более универсальным и хорошо связываться со всеми центромерами в геноме, чтобы ни одна хромосома чересчур не преуспела и не испортила раздачу наследственного материала. Если за одну хромосому кинетохор схватится сильнее (и приведет больше моторных белков), а за другую слабее — то поровну хромосомы при делении не разойдутся, а потомки клетки не выживут. Получается, что центромеры все время прихорашиваются, чтобы понравиться белку, а тот постоянно меняет свои предпочтения, чтобы сохранить статус-кво. Поэтому, кстати, CENP-A тоже очень сильно различается у близких видов. Двигатель самолета меняется вместе с самолетом — и поэтому полет продолжается.

CENP-A «клюет» на вполне конкретную 171-нуклеотидную последовательность. Но в ней, естественно, возможны варианты, и они могут быть как более, так и менее соблазнительными для белка. Кажется, играет роль и то, сколько раз эта последовательность повторяется: чем повторов больше, тем выше шанс, что именно здесь сядет CENP-A. Поэтому со временем центромерных повторов (мономеров) на хромосоме становится все больше и больше — что в итоге и оставило «Геном человека» с неполной расшифровкой ДНК на руках. На месте центромеры и других кусков гетерохроматина в тексте генома пришлось оставить прокси (то, что худо-бедно удалось собрать).

«Они не были реальными сиквенсами, — объясняет Андрей Бзикадзе из Калифорнийского университета в Сан–Диего, который занимается заполнением этих пробелов 20 лет спустя. — Не существует биологического образования, будь то клеточная линия или человек, у которого бы были такие последовательности ДНК. Отдельные слова и предложения в эти областях напоминали реальные, но их порядок реальным не был».

А где-то собрать вообще ничего не вышло, там в тексте последовательности шли просто буквы N.

Техника чтения

Чтобы выяснить, что написано внутри центромеры, нужно было рассмотреть ее целиком или хотя бы крупными кусками, чтобы не потеряться в отдельных мазках. Но в 90-е биологи, вооруженные методом дробовика, могли прочесть только короткие мелкие отрывки в несколько сотен нуклеотидов.

Как это работало: берем множество копий одного и того же кусочка ДНК и начинаем к ним достраивать пары, подставляя по одному подходящие нуклеотиды. При этом в растворе кроме обычных аденина, гуанина, тимина и цитозина, плавают такие же нуклеотиды, но со светящейся меткой (для каждого типа — отдельный цвет). Каждый раз, когда такой нуклеотид попадает в строящуюся нить, синтез останавливается — больше к нему ничего уже прикрепить нельзя. Таким образом, в растворе появляется набор укороченных кусочков ДНК — в 1, 2, 3 и так далее нуклеотидов, и на конце у каждого светящаяся метка, которая сигнализирует о том, какая буква оказалась последней.

Дальше можно весь этот набор кусочков загрузить в гелевую пластинку или в капилляр и заставить их ползти вперед под действием электрического тока. Чем короче кусочек, тем дальше он доберется, и на выходе получится лесенка: кусочки встанут по росту, длинные и тяжелые ближе к старту, короткие к финишу. Каждый из них будет светиться одним из четырех цветов. После этого можно на них посмотреть (невооруженным глазом или специально обученным прибором) и считать цветовую последовательность, по ходу дела переводя ее в буквы.

Этот метод хорошо работает, если нас интересуют короткие участки ДНК. Когда же кусочки в растворе слишком длинные, то точность снижается: для него нить ДНК длиной в 1000 нуклеотидов отличается от нити из 1001 нуклеотида намного меньше, чем нить из трех нуклеотидов от нити в четыре. Поэтому выяснить, в каком порядке расположены те или иные буквы, уже не получается.

Чтобы научиться читать длинные последовательности, нужно было создать принципиально другую технологию секвенирования. Ее придумали в 2003-м, но дорабатывали еще несколько лет. Идея заключалась в том, чтобы не делать множество копий, дробить их на кусочки и потом собирать из них генетический пазл — а читать последовательность на ходу, в процессе ее копирования. То есть использовать ДНК-полимеразу как секвенатор.

Для этого предстояло научиться следующим вещам:

  • фиксировать ДНК-полимеразу на дне сосуда (иначе она будет плавать по раствору, и ее сложно будет рассмотреть);

  • найти такие красители, которые не останавливают реакцию (то есть не мешают нуклеотидам встраиваться в растущую цепь один за другим);

  • фокусировать микроскоп на одной-единственной молекуле.

Секвенатор нового образца собрали в 2009 году. Новая методика выглядела так: на дне сосуда заякорена ДНК-полимераза, которая протягивает сквозь себя нить ДНК, достраивая к ней копию. В растворе плавают нуклеотиды с пришитыми метками, и все они светятся — но прибор этого не замечает, потому что сфокусирован только на активном центре полимеразы. Каждый раз, когда она хватает новый нуклеотид и удерживает его достаточно долго, чтобы присоединить к строящейся цепи, секвенатор распознает светящуюся метку — и вписывает в расшифрованную последовательность новую букву. Потом полимераза окончательно присоединяет нуклеотид, но его «хвост» с пришитой меткой при этом отваливается. Сигнал прерывается — до того, как полимераза хватается за следующий нуклеотид.

Теперь генетики могли отложить дробовики в сторону и перейти на орудия калибром посерьезнее — чтобы больше не пытаться восстановить портрет центромеры из пепла, а собрать ее, как конструктор, из крупных обломков. На то, чтобы доработать метод и научиться обрабатывать действительно длинные фрагменты ДНК, ушло еще 10 лет. Сейчас такие участки ДНК сшивают в кольцо, чтобы полимераза прошлась по одному и тому же месту несколько раз подряд. Потом результаты можно сравнить, найти опечатки и получить довольно чистый сиквенс.

После этого генетики объединились в консорциум «От теломеры к теломере» (T2T), чтобы прочесть ДНК от корки до корки, включая “функциональные области, которые оставались за бортом”. В 2019 году Консорциум собрал половую Х-хромосому, потом восьмую хромосому — с одной из самых коротких центромер. А в 2021 году закончил работу над геномом человека.

Еще до сиквенсов Т2Т было понятно, что центромеры человека собраны из небольших повторов, мономеров. А они, в свою очередь, собираются в кластеры по полтора десятка штук — их называют HOR, high-order repeats. И эти кластеры тоже многажды повторяются. Но соседние мономеры в одном HORе могут отличаться друг от друга. И соседние HORы могут отличаться. А на разных хромосомах в геноме одного человека HORы могут быть настолько непохожи, что их относят к разным семействам. В общем, чтобы разобраться в структуре длиной в миллионы нуклеотидов, нужно было написать алгоритм, который бы ее разметил.

«Эта задача [только] кажется простой, — рассказывает Кунявская. — Сложность в том, что мы не знаем, что ищем. Есть вариации HOR, есть гибридные мономеры. Есть HOR с неправильной структурой, есть более длинные или короткие. Непонятно, как найти канонический HOR. Непонятно, какие мономеры главные, а какие — вариации. Вот, например, что такое стул? Это что-то на четырех ножках. А если это барный стул? Значит, это что-то на чем сидят. А если я сяду на стол? И так далее. Никто не знает, как правильно: как аннотировать? Как называть? Что принимать за базу?».

То, что у ученых из СПбГУ получилось сделать сейчас — это лишь один из вариантов разметки центромеры, отработанный на одном конкретном геноме. Главное, отмечает Кунявская, что он воспроизводим: потом можно будет взять тот же алгоритм и применить его для аннотации других центромер. И уже после этого оценить, насколько он оказался правдоподобным и полезным. «Сейчас у меня есть запуски аннотаций для орангутана, человека и шимпанзе, — рассказывает она, — и там получаются разные мономеры и разные структуры. И самое интересное — это сравнить двух людей, в чем они одинаковые и разные, [чтобы понять], как они эволюционировали».

И тут, оказалось, центромеры могут рассказать то, о чем другие гены умалчивают.

Хромохронология

Самые маленькие из описанных центромер у дрожжей, они занимают всего 125 пар нуклеотидов. У людей центромеры растянулись на миллионы пар, это на несколько порядков больше, чем нужно моторному белку, чтобы схватить хромосому. И сейчас, собрав наконец-то их структуру воедино, мы можем представить себе, почему они такие длинные.

«Логика заставляет предполагать, что сначала эта штука не была такой большой, — говорит Иван Александров. — Сначала было несколько повторов, потом они начали разрастаться, и вот огромный кластер». И хотя, по словам ученого, «напрямую этого никто не видел», другого способа объяснить появление такой сложной структуры у него с коллегами нет.

Теперь жизненный цикл центромеры генетики описывают так. Вначале есть участок ДНК, с которым связываются белки кинетохора. Он состоит из небольших мономеров. В какой-то момент в одном из мономеров возникает мутация — буквально 3–5 точечных замен — которые делают его еще более липким для белков. «Кинетохор сидит на том месте, где сумма аффинностей (то есть сила «притяжения» — прим. N + 1) к нему больше, — объясняет Александров. — И если появляется что-то, на чем ему больше нравится сидеть, то он начинает постоянно сидеть там. А поскольку он размножает то, на чем сидит, то эта штука начинает расти».

Новый липкий мономер случайным образом удваивается. Точный механизм этого пока неизвестен, но есть подозрение, что виноват в этом прямо или косвенно сам кинетохор. Двойка мономеров притягивает кинетохор еще сильнее. Дальше удваиваются уже эти два мономера, потом удваивается четверка — эгоистический отбор все это только приветствует. Кроме того, эти повторы могут перескочить на соседнюю хромосому, потому что похожие участки в разных хромосомах могут слипаться. Такое возможно только для очень близких друг к другу последовательностей — и это отлично работает с повторами центромер, которые отличаются только точечными заменами.

В результате мономеры размножаются, прыгают с хромосомы на хромосому, собираются в кластеры, распространяются уже целыми кластерами — все это работает, пока они лучше прочих заманивают на себя белки кинетохора. Так посреди центромеры возникает центр притяжения и начинает разрастаться. А те повторы, на которых кинетохор сидел раньше, никуда не пропадают, а просто отодвигаются к краю. Забытые кинетохором и больше ни для чего не нужные, они превращаются в зону неактивной центромеры.

Здесь, на свалке истории, мономеры и их кластеры начинают мутировать c невероятной скоростью — в десятки раз быстрее, чем прежде. За миллион лет они могут накопить около 10 процентов отличий друг от друга. Как именно им это удается, толком неизвестно, но ученые подозревают, что там работает какой-то особенный механизм «гипермутабильности». «Обычный темп эволюции [активных центромерных повторов] — это 0,2 процента за миллион лет, — объясняет Александров. — Чтобы набрать один процент мутаций, вам надо пять миллионов лет, а если 10 — то уже 50. Это никакой эволюции приматов не хватит [чтобы в таком темпе накопить столько отличий, как у мертвой центромеры]».

В итоге неактивные мономеры и HORы очень сильно отличаются и от своих соседей по хромосоме, и от других хромосом. А поскольку они больше ни на что не похожи, им сложнее слипаться с другими хромосомами. Они перестают перепрыгивать с одной на другую, перестают удваиваться, а повторы начинают теряться. Получается, что в центре центромера растет, а по краям, наоборот, съеживается. И от того, что когда-то было живой центромерой, остаются своеобразные годичные кольца.

Поэтому Александров считает, что центромеру можно использовать как источник филогенетической информации. Причем более точный, чем остальные. «В любом фрагменте ДНК есть мутации, которые произошли в разное время. Но там старые и новые мутации все смешаны в одном фрагменте, они пространственно не разделены. Представьте себе, что [культурные] слои под городом были бы жидкие, и все сваливалось бы вниз. Смогли бы мы что-то понять [о ходе истории]? Смогли бы, наверно, [что-то предположить] просто по сложности керамики. [Пусть] самая примитивная — самая старая, а самая изысканная — самая сложная. Но, конечно, ошибки были бы: если город завоевали варвары и вернулась простая керамика, мы считали бы, что она самая старая, а на самом деле нет. А центромера — это как у Шлимана: Троя-2, Троя-3, Троя-4. Когда слои откладываются один под другим, то все понятно».

Остатки старых центромер, конечно, в хромосоме хранятся без какого-либо археологического надзора — они ломаются и мутируют. Но и тысячелетняя керамика до нас доходит, как правило, в виде черепков. А каждый из мономеров накапливает свои точечные изменения независимо от соседей. Поэтому можно сравнить их между собой — здесь в дело как раз вступают биоинформатики — отбросить новые мутации и восстановить исходную цепочку.

У центромеры есть еще одно преимущество. Остальные части хромосомы регулярно рекомбинируют: в предшественниках половых клеток пара одинаковых хромосом от матери и от отца сходится и обменивается небольшими частями. Так возникает генетическое разнообразие — и одновременно с ним возникают проблемы для изучения эволюции. «Геном человека это кусочки разного возраста, но рекомбинация их все время перемалывает, — поясняет Александров. — И мы не можем у человека [среди генов] найти большой кусок ДНК, как она была у условного Адама».

В центромерах этого не происходит, там рекомбинация подавлена. «Это гигантский кусок, по 10 мегабаз (миллионов пар оснований — прим. N + 1) старой ДНК, — продолжает ученый. — И в одной хромосоме вы можете увидеть кусочек ДНК, который со времен Адама ни разу не рекомбинировал, это ДНК Адама. А в другой, например, ДНК Авраама. А в третьей — Ваня Александров». 

Рассматривая эти наслоения в человеческих хромосомах, можно восстановить эволюционное дерево приматов. Вот что получилось у Александрова и его коллег. Внешний слой старых центромер содержит мономеры, похожие на то, что есть у современных обезьян Нового Света (они же широконосые, вроде ревунов и капуцинов) — значит, он остался от нашего общего с ними предка. Ближе к центру лежат слои, которых у капуцинов нет, зато они встречаются у всех обезьян Старого Света (узконосых), например, резусов и павианов. Следующие за ними слои, видимо, появились позже — их можно найти только у человекообразных обезьян. Потом лежит слой, характерный для гоминид, то есть людей, орангутанов, горилл и шимпанзе. И только у последних двух есть общие с нами, самые новые слои центромеры.

Для большинства слоев в человеческих центромерах можно подобрать ветку приматов, у которой они, предположительно, появились. Но некоторые слои в этом смысле вызывают подозрение. Это, например, слой SF9 (на графике выше он красный) — мы пока не знаем таких животных, у которых бы он уже был, а SF7 (зеленого), который восходит к макакам, не было. Или S10 (коричневый). «Было много всяких таксонов приматов, — предполагает Александров, — но они не выжили. А мы можем восстановить эти missing links. Мы можем сказать: этот слой был, хотя не осталось живых представителей».

За SF12 есть и другие, еще более древние слои. Но от них, по словам генетика, осталось буквально несколько фрагментов. Их даже не с кем сравнить. «Если идти назад, — говорит Александров, — там следующая [известная нам] ветка тарзьеры (долгопятовые — прим. N + 1), потом лемуры. У них в центромерах другие повторы. Похоже, что за сто миллионов лет примерно все теряется, а если и останется один кусочек, то трудно доказать, что это действительно было центромерой. [Так что] этим фонариком можно посветить где-то на сто миллионов лет».

Такое центромерное датирование, уверен Александров, может помочь гораздо точнее определять принадлежность ископаемых останков. «Если бы ДНК можно было извлекать из миллионолетних костей, то таким способом можно было бы расклассифицировать все приматные остатки и совершить революцию в антропологии. Но поскольку прогресс тут идет, то может быть это и получится когда-нибудь».

Начинать Александров предлагает с гигантопитека. «Он раньше считался гигантским человеком, — рассказывает ученый, — но потом обычными методами выяснили, что это ветка орангутана. Он был продвинутый такой, похож [на человека] анатомически. Эти гигантопитеки вымерли не так давно, и в Китае, говорят, на рынках продаются их зубы как драконовы зубы для увеличения потенции. Взять бы вот этот зуб, из него извлечь какие-то мелкие частички — повторы хороши тем, что мелких фрагментов достаточно — и сказать: для орангутана характерен синий слой. У клады горилла-человек-шимпанзе появляются следующие слои, а у гигантопитека не должно быть этих слоев, последний будет синий. И тогда мы точно сможем сказать, что это не человеческая линия. Я агитирую кого-нибудь этим заняться, но пока не сагитировал».

Можно попробовать отследить и гораздо более близких родственников современных людей — вроде неандертальцев и денисовцев. «Эволюционная история очень длинная, точки очень далеко расставлены, — сетует Александров. — Денисовцы — это точка в белом поле. Если к этой точке добавить еще неандертальца, африканца, неафриканца — мы могли бы понять гораздо больше».

У неандертальцев и денисовцев, по словам ученого, те же HORы, что у современного человека. Но укороченные варианты одного HORa могут отличаться. И у отдельных редких людей Александров с коллегами уже обнаружили центромеры, состоящие из этих неандертальских и денисовских вариантов — видимо, это последствия давнего скрещивания популяций. А поскольку центромеры не рекомбинируют, то можно считать, что в таких хромосомах остался длинный кусок неандертальской и денисовской ДНК. «И если вы найдете такую центромеру, — говорит ученый, — то будете иметь сразу 15 мегабаз ДНК денисовца. И можете их изучать, и можете делать много интересных выводов про то, как оно эволюционировало».

Место для шага вперед

Но пока до интересных выводов дело не дошло. «Это все стало понятно только сейчас, — объясняет Александров, — из [работы] T2T. Это первый раз, когда сложили [целиком] большие центромеры». До сих пор генетикам приходилось довольствоваться отдельными короткими сиквенсами, моделями и приблизительными реконструкциями. Это не позволяло искать тонкие различия в отдельных мономерах — хотя было достаточно, чтобы представить себе в общих чертах и механизмы эволюции центромеры, и ее общую структуру, и расположение ее годичных колец.

Теперь, когда появились полностью расшифрованные центромеры, можно на них проверить предположения и модели, которых накопилось немало за последние тридцать лет. «То, что сделано в этих статьях в Science, — это как гробница Тутанхамона, — говорит Александров. — В ней не было ничего нового, наверное. Чего никто никогда не видел. В качестве отдельных предметов это все уже где-то существовало. Но вот мы туда зашли и увидели все вместе в нетронутом состоянии, и это впервые».

Но чтобы разобраться до конца с тем, что это значит, генетикам предстоит найти и описать еще множество подобных гробниц. Полный геном, который сейчас собрал консорциум T2T — это хромосомы одного-единственного человека, а точнее — одной человеческой опухоли. Ее выбрали вовсе не потому, что она больше всего похожа на клетку среднестатистического человека, а потому, что она гомозигота, то есть вместо материнского и отцовского набора хромосом у нее удвоенный отцовский комплект. Это помогает избежать путаницы при секвенировании: не нужно выяснять, какой хромосоме из пары принадлежит каждый кусочек.

Чтобы перейти на следующий этап, нужно отработать методику секвенирования для гетерозиготных геномов. Это, по словам Александрова, следующая задача, которая стоит перед T2T. После этого можно будет отсеквенировать гораздо больше разных центромер, сравнить их между собой и составить представление о том, что с ними происходит в популяциях современных людей.

Судя по предварительным данным, там творится немало интересного.

Например, еще в 2012 году выяснилось, что на хромосоме номер 17 кинетохор может появляться в разных местах. Причем это может происходить даже в пределах одной клетки человека: на материнской хромосоме он садится как обычно, на «живой» центромере, а на отцовской — где-то сбоку, на неактивной области. «Бывают какие-то токсичные укороченные варианты [HORов], которые кинетохору не нравятся, — рассказывает Александров. — И если у какого-то человека их много развелось, то он уходит, если есть какая-нибудь дополнительная посадочная площадка».

В нынешней сборке генома следы прыжков кинетохора нашли еще на одной хромосоме — на половой Х. По ней он прыгает в пределах живой центромеры: характерные для кинетохора белки обнаруживаются то с одного края, то с другого, а то и посередине активного набора HORов. И со временем такие кинетохорные карты наверняка построят и для других хромосом человека.

Эти метания кинетохора по хромосоме — судя по всему, и есть эволюция в действии. Разные места посадки конкурируют друг с другом за притяжение белков, и можно ожидать, что со временем одно из них отомрет и будет постепенно съеживаться и исчезать. А другое выиграет и начнет расти — до тех пор, пока внутри него или рядом с ним не появится новый, более привлекательный для кинетохора участок.

Александров подозревает, что непостоянство кинетохора неслучайно. Сама по себе структура центромеры — множество повторов, «мертвая» зона с запасом старых повторов, усиленное накопление мутаций на ее обочине — как нельзя лучше подходит для того, чтобы кинетохор мог липнуть к хромосоме в нескольких местах сразу. «Создается ощущение, — рассуждает он, — что центромера специально устроена так, чтобы обеспечить смену декорации, чтобы генерировать разнообразие».

У генетика есть и свое объяснение того, для чего это нужно. «Новая центромера — [это] новый вид, — рассуждает он. — Когда на одной территории существует старый вид и возникает новый, то нет возможности это сделать, если вы между ними не учредите барьер нескрещивания». А если у них активные центромеры в разных местах или с разной последовательностью, то у их потомков начнутся проблемы с образованием половых клеток. Две хромосомы несимметрично встанут друг напротив друга в центре клетки-предшественника, и когда их начнут разводить по сторонам, натяжение может оказаться неравномерным. В таком случае одна из хромосом может уехать не туда, куда нужно. Одна из клеток получит лишнюю хромосому, а у другой, наоборот, будет недостача (эти ситуации называют анеуплоидиями) — и если такое происходит при образовании половых клеток, то организм производит меньше потомства, а то и вовсе остается бесплодным.

Поэтому, заключает Александров, склонность центромер к быстрой эволюции может быть нужна для того, чтобы быстро образовывать и разделять новые виды. И это, подозревает он, может быть особенно характерно для отдельных таксонов, например для приматов. По крайней мере, у других групп животных пока не нашли ни таких разнообразных HORов, ни ускоренного мутирования мертвых центромер, ни следов таких частых прыжков кинетохора.

Действительно ли в постоянной «смене декораций» есть особенный смысл, пока проверить невозможно. Зато можно себе представить, какую цену за нее нам приходится платить. Если в популяции уже есть хромосомы с разными местами посадки, это может быть одной из причин бесплодия или хромосомных аномалий. «По Х-хромосоме это на сто человек одна [аномалия], — говорит Александров, — они очень частые, и видимо часто проходят недиагностированными. Но в случае с Х эти анеуплоидии выживают, потому что лишние Х-хромосомы инактивируются, а для остальных [хромосом] это бесплодие».


***

В 1990 году Роберт Синшеймер, один из идеологов «Генома человека», сравнил секвенирование генома с открытием Америки, которому как раз должно было исполниться 500 лет. Этот проект, по его мнению, должен был многое рассказать о том, «кто мы такие и как мы благодаря эволюции стали теми, кто мы есть». Правда, Синшеймер полагал, что ответ на этот вопрос, равно как и записи о нашем прошлом, лежит в генах, и едва ли думал о «бессмысленных» частях ДНК, которые молча обслуживают работу и размножение генетического «смысла».

Расшифровка этих частей затянулась на двадцать лет. И смысла им не прибавила. Но показала их значение: они хранят наше прошлое. А если присмотреться — то и кусочки будущего.

Полина Лосева

Нашли опечатку? Выделите фрагмент и нажмите Ctrl+Enter.