Ученым удалось прочитать геном человека при помощи «карманного» прибора для секвенирования MinION размером со смартфон. В статье, опубликованной в Nature Biotechnology, также описан поставленный с помощью того же устройства рекорд по самому длинному прочтению молекулы ДНК — длина непрерывного прочтения составила 882 тысячи пар оснований.
Несмотря на то, что на сегодняшний день прочитаны геномы десятков видов животных, а стоимость секвенирования снизилась на порядки по сравнению с первыми подобными экспериментами, определение полной последовательности ДНК эукариотических организмов все еще представляет собой нетривиальную задачу. В основном это связано с тем, что значительная часть генома представляет собой повторяющиеся последовательности — микросателлитную ДНК, тандемные повторы, ретроэлементы и так далее.
Самая распространенная технология высокопроизводительного секвенирования ДНК на сегодня подразумевает разбиение молекулы ДНК на маленькие кусочки в несколько сотен пар оснований, их амплификацию (размножение) и прочтение. Из таких маленьких кусочков при помощи математических алгоритмов затем восстанавливают полную последовательность генома (этот процесс называется сборкой). Многие участки ДНК, особенно содержащие повторы, при этом вообще выпадают, либо исследователи не уверены в их точной последовательности. Даже в референсном геноме человека, который впервые опубликовали в 2001 году, до сих пор есть пробелы.
Чтобы этого избежать, инженеры сосредоточились на технологиях секвенирования, которые позволяют определять последовательность как можно более длинной молекулы ДНК, причем желательно без амплификации. На сегодняшний день самым популярным решением для прочтения и сборки больших геномов была технология компании PacBio, позволяющая непрерывно прочитать несколько десятков тысяч пар. Для маленьких геномов, например, бактериальных, компания Oxford Nanopore Technologies в 2014 году предложила «карманный» секвенатор MinION, который также способен непрерывно прочитывать длинные последовательности, но при этом ограничен по емкости.
MinION представляет собой прибор размером со смартфон, который подключается к компьютеру через USB-кабель. Принцип его действия основан на измерении электрической проводимости во время протягивания молекулы ДНК через пору в мембране прибора. Стоимость прибора и стартового набора реактивов составляет тысячу долларов, что по сравнению с другими существующими технологиями довольно дешево. Разработчики позиционируют его как полевой секвенатор, который может быть использован «в джунглях, в Арктике, на космической станции». В подтверждение тому недавно при помощи MinION на МКС действительно прочитали несколько последовательностей ДНК, в том числе митохондриальный геном мыши.
Исследователи из нескольких американских и канадских институтов, в том числе университета Калифорнии и Национального исследовательского института генома человека (США) показали, что при помощи MinION можно успешно прочитать геном человека. Более того, ученые оптимизировали протокол секвенирования для прочтения ультра-длинных фрагментов ДНК в сотни тысяч пар оснований.
Размер генома человека составляет примерно 3 миллиарда пар оснований (три гигабазы). Прочтение ДНК клеточной линии человека GM12878 было проведено силами сотрудников пяти лабораторий, в работе было использовано 39 рабочих ячеек MinION и оптимизированный протокол пробоподготовки. В итоге ученые получили 91,2 гигабаз данных, что соответствует 30-кратному покрытию генома. Длина более половины прочтенных фрагментов ДНК составила 100 тысяч пар оснований и более. Дополнительно исследователи показали, что с оптимизированным протоколом возможно определение последовательности ДНК до 882 тысяч пар оснований. Фактически, максимальная длина прочтения определяется только качеством выделения ДНК.
Для объединения последовательностей в одну авторам пришлось оптимизировать также алгоритмы сборки, так как большинство существующих программ заточены под короткие фрагменты. После сравнения с референсным геномом линии GM12878, который был прочтен более традиционными методами много раз, оказалось, что полученная последовательность покрывает 85,8 процентов генома, а точность сборки приближается к 100 процентам.
Прочтение таких длинных фрагментов ДНК в ходе секвенирования позволило авторам заполнить пробелы в последовательности человеческого генома и упростить анализ многих его участков. К примеру, локус главного комплекса гистосовместимости (HLA) имеет сложную структуру и множество повторов, поэтому его последовательность очень сложно определять. В данном случае все гены попали в одну непрерывную прочтенную последовательность, что избавило исследователей от необходимости кропотливо собирать ее из кусочков. Помимо этого, ученые продемонстрировали возможность распознавать при помощи этой технологии секвенирования эпигенетические метки, в частности, метилирование ДНК, что с другими технологиями было невозможно.
Секвенирование генома человека является своеобразной контрольной точкой в определении производительности технологии. Данная работа обещает дальнейшее упрощение и удешевление не только непосредственного определения последовательности ДНК, но и ее анализа. Подробнее об истории развития технологий секвенирования ДНК можно прочитать в нашем материале.
Дарья Спасская