Ученые создали наиболее полную библиотеку следов нуклеиновых кислот микробиоты в анализах онкологических пациентов и с помощью методов машинного обучения выделили микроорганизмы, специфичные для различных типов опухолей. В перспективе это позволит создать новый универсальный метод диагностики рака на ранних стадиях по анализу крови. Статья опубликована в журнале Nature.
Обновлено: в июне 2024 года публикация была отозвана из Nature.
Рак принято рассматривать как заболевание, которое напрямую связано с человеческим геномом, однако недавние исследования установили, что микробиом также влияет на опухоли и препятствует их эффективному лечению. До сих пор не известно, какой именно вклад обитатели нашего организма вносят в развитие различных типов рака. Исследовать эту зависимость трудно, потому что в процессе сбора и анализа образцов высока вероятность загрязнить их дополнительными нуклеиновыми кислотами.
Поиском простого и эффективного анализа, который мог бы выявлять рак различных типов на ранних стадиях, занято множество исследователей по всему миру. Сейчас разрабатывают целый ряд тестов, которые определяют опухоли по образцу крови; в качестве маркеров используют специфические белки или мутантную ДНК. Современные технологии статистической обработки результатов секвенирования ДНК позволяют исключить из анализа генетические следы, которые были внесены в образцы извне, и открывают возможность диагностировать рак по составу микробиоты.
Группа ученых под руководством Грегори Пура (Gregory Poore) из Калифорнийского университета в Сан-Диего проанализировала более 18 тысяч образцов, взятых у пациентов с 33 типами опухолей, из Атласа ракового генома на наличие в них микробной ДНК или РНК. К базе данных применили два независимых метода отбора и исключили материал, наличие которого могло быть следствием технической погрешности или загрязнения образца.
Затем ученые применили к данным (неразмеченные данные, затрагивающие 17 тысяч образцов 32 видов рака) стохастический градиентный бустинг, который должен был отличать опухолевые образцы от нормальных и классифицировать их по типам рака. Для проверки результата выборку разбили на две части, обучили алгоритм на каждой из них по отдельности, а затем применили полученные модели к другой половине данных. После этого отобрали образцы только пациентов на первой и второй стадиях рака (существующие методы диагностики плохо работают на ранних сроках) и провели обучение на них.
Финальной стадией была проверка алгоритма в условиях реальной жизни. Для этого исследователи взяли анализы крови у 69 здоровых людей и 100 пациентов на третьей или четвертой стадии одного из трех типов рака (рак простаты, легких или меланома) и секвенировали плазменную внеклеточную ДНК. К полученным образцам микробной ДНК применили алгоритм, выработанный на Атласе ракового генома.
В итоге даже после отбраковки больше 90 процентов данных модель успешно определяла тип опухоли как на всех стадиях, так и только на ранних. При тестировании в реальных условиях алгоритм идентифицировал более 90 процентов пациентов с раком, и не дал ложно-позитивных результатов для здоровых людей. Модель в 81 проценте случаев правильно отличила образцы больных раком легких и раком простаты.
Остается неясным, как микроорганизмы, ДНК которых использовали в анализе, связаны с развитием рака. Также непонятно, где находятся эти существа — в опухоли, в иммунных клетках или соединительной ткани — их следы могли попасть в кровь в любом из этих случаев. Неизвестно даже, были ли они живыми при взятии анализа.
Помимо следов микроорганизмов, исследователи пытаются выделить и другие маркеры опухолей. В 2018 году ученые создали тест, который позволяет с высокой точностью диагностировать восемь видов рака на ранних стадиях. В основе этого анализа лежит определение внеклеточных ДНК и белков, характерных для опухолей.
Алиса Бахарева
С точностью в 79 процентов
Коллаборация британских и немецких ученых провела системный анализ протеомики пациентов с болезнью Паркинсона и выяснила, что экспрессия восьми белков плазмы крови может предсказывать развитие заболевания за семь лет до появления первых симптомов. В исследовании, опубликованном в журнале Nature Communications, предсказание оказалось верным для 79 процентов испытуемых.