Рассказываем, что такое большие данные с точки зрения медицины, и как они могут помочь поставить диагноз именно вам
В 2009 году известный журнал Timе в списке «идей, которые меняют мир прямо сейчас», упомянул биобанки. Это произошло всего через три года после запуска масштабного проекта UK Biobank, который к сегодняшнему дню стал источником данных для тысяч популяционных исследований, касающихся здоровья людей. Есть ли биобанки в России, как они связаны с персонализированной и цифровой медициной и какую пользу из них могут извлечь исследователи, а в перспективе и мы с вами, рассказываем вместе с Сеченовским Университетом.
В проекте «Биодизайн» вместе с Сеченовским Университетом мы рассказываем, как медицина становится все более персонализированной, зачем нам нужны биобанки и есть ли они в России, а также сможем ли мы отказаться от исследований на мышах, собаках и обезьянах.
Прочитайте эти два факта и попробуйте угадать, что их связывает:
1) Хроническое злоупотребление кофеином может стать причиной изжоги.
2) Вероятность заболеть ковидом в тяжелой форме выше, если вы живете один, чем если вы живете в семье.
Ответ — оба этих вывода сделаны в исследованиях, опирающихся на одну и ту же глобальную выборку цифровых медицинских карт под названием UK Biobank. Проект, который стартовал в 2006 году, уже собрал детальную информацию о 500 тысячах британцев в возрасте от 40 до 69 лет: что они едят и пьют, любят ли смотреть телевизор, сколько весят, сколько имеют детей, чем болеют и как лечатся.
Карты добровольцев, данные которых содержатся в банке в виде анонимных записей, кроме личных привычек, содержат довольно специальную информацию, такую как внутриглазное давление и генетические данные, собранные при помощи масштабных панелей однонуклеотидных полиморфизмов ДНК. Важная особенность этого биобанка в том, что данные о состоянии здоровья добровольцев продолжают собирать на протяжении всей их жизни (так называемое проспективное когортное исследование). К примеру, к 2017 году в картах участников было зафиксировано 1,3 миллиона госпитализаций, 40 тысяч человек из этой выборки заболели раком.
Эта масштабная база данных стала настоящим кладом для исследователей из разных областей медицины, генетиков и статистиков, которые ежедневно находят новые закономерности в том, как связана склонность к тем или иным привычкам, генетическая предрасположенность и состояние здоровья человека. Если в 2012 году на основе базы данных UK Biobank было опубликовано 13 научных работ, то в 2022 уже 486.
Британский биобанк стал таким ценным инструментом за счет двух преимуществ — большое количество участников и огромное число параметров, которые заносятся в персональные карты. Помимо пары упомянутых выше, у людей фиксировали множество других показателей здоровья, таких как состав тела, измеренный при помощи импедансометрии, электрокардиограмма в покое и при выполнении физических упражнений и так далее. Кроме того, эти карты содержат не только оцифрованные показатели здоровья, у добровольцев собирали также образцы крови, слюны и мочи. Таким образом, этот биобанк существует в том числе как физическое хранилище образцов, к каждому из которых привязана подробнейшая цифровая карта.
Зачем нужно было привлекать к этому проекту столько человек? Дело в том, что многие закономерности хорошо становятся видны лишь в масштабе. Наглядный пример приводит эпидемиолог из Оксфорда Томас Литтлджонс в своей статье о том, как биобанк помогает кардиологам. Сейчас связь высокого кровяного давления и вероятности развития сердечной ишемии кажется нам довольно очевидной, но в середине XX века, когда врачи впервые об этом задумались, это не было таким явным. Одно из первых подобных когортных исследований (Framingham Heart Study, проведенное в США) включало в себя 5 200 человек. Казалось бы, это довольно много, однако итоговые графики получились совсем не убедительными. Более того, из этих данных можно было сделать вывод, что в некоторых возрастных группах с увеличением кровяного давления смертность падает. Эффект стал куда более явным, когда подобный статистический анализ провели на выборке в 50 тысяч человек. Наконец, графики для выборки в полмиллиона человек не оставляют никаких сомнений, что, чем выше давление по сравнению с нормой, тем выше вероятность умереть раньше времени. Для врачей это значит, что для сохранения здоровья пациентам нужно обратить внимание на стратегии, нормализующие кровяное давление.
UK Biobank всего лишь самый крупный и знаменитый биобанк, в том числе благодаря своей «универсальности». Из-за большого числа параметров исследователи могут изучать совершенно разные показатели здоровья. Однако у него есть и серьезный недостаток: он является популяционным, то есть содержит биоматериал только коренных жителей Великобритании. По-хорошему, выводы, сделанные на этой выборке, можно распространять только на белых европейцев. Поэтому исследователи в каждой отдельной стране заинтересованы в создании национальных популяционных биобанков, которые содержали бы образцы и ассоциированную с ними информацию для представителей популяций, проживающих на территории данного государства или даже в географической области.
Примером такого биобанка можно назвать Биобанк народонаселения Северной Евразии, который был создан под руководством генетика Олега Балановского и к 2016 году насчитывал более 25 тысяч образцов из 274 этнических групп, проживающих на территории России и соседних стран. Генетический анализ этих групп позволяет не только установить закономерности, например, о родстве и темпах расселения разных народов, но и сделать интересные выводы, имеющие отношение к медицине. Например, в 2021 году генетики обнаружили, что один из маркеров, ассоциированных с вероятностью заболеть ковидом в тяжелой форме, встречается преимущественно в Западной Евразии.
Более распространены биобанки другого типа, которые называют нозологическими — они содержат биоматериал и записи о пациентах, страдающих конкретным заболеванием. Масштабный анализ образцов и медицинских карт в таких биобанках позволяет обнаружить новые маркеры заболевания, оптимизировать как диагностику, так и схемы лечения.
На сегодняшний день наиболее «продвинутыми» можно назвать онкологические биобанки, которые содержат образцы опухолей и биологические жидкости пациентов, страдающих различными типами рака. Прогноз и тип лечения в онкологии зачастую определяется молекулярно-генетическими особенностями опухоли, поэтому для полноты картины для каждого пациента важно исследовать панель генетических маркеров, а лучше полностью определить последовательность ДНК опухоли и здоровой ткани. К примеру, биобанк Международного агентства по исследованию рака Всемирной организации здравоохранения (IARC, International Agency for Research on Cancer) содержит более 5 миллионов образцов от более чем полумиллиона пациентов. Биобанк объединяет в себе около 50 отдельных исследовательских коллекций из разных стран и предоставляет услуги хранения образцов и выделения из них ДНК по строго стандартизованным протоколам. Сама организация IARC ведет свою историю с 1965 года и считает своей главной исследовательской задачей поиск веществ, вызывающих рак.
На базе ФГАОУ ВО Первый МГМУ им. И. М.Сеченова Минздрава России (Сеченовский Университет) в 2017 году был создан исследовательский нозологический биобанк, который играет роль репозитория Научного центра мирового уровня «Цифровой биодизайн и персонализированное здравоохранение». В рамках централизованного сбора образцов пациентов онкологического профиля из клиник Сеченовского Университета по проекту НЦМУ с 2021 года собрано более 11 тысяч образцов плазмы, сыворотки и цельной крови от более чем 1 600 пациентов. В коллекции представлены образцы от пациентов с новообразованиями кишечника, поджелудочной железы, почек, предстательной железы, мочевого пузыря, мягких тканей головы и шеи, молочной железы, средостения, легкого, забрюшинного пространства, половых органов, печени и др.
По словам директора Научно-технического парка биомедицины Сеченовского Университета Петра Тимашева, работа с образцами подразумевает не только их хранение, но и морфологический, иммуногистохимический и молекулярно-генетический анализ опухолей, а также сбор детальной информации о протекании заболевания у пациента, назначенную терапию и данные анализов.
Анализ данных от множества пациентов может помочь установить новые закономерности в терапии опухолей. В качестве примера можно привести случай с таргетным препаратом «Иресса», который в 2002 году проходил клинические испытания в качестве терапии немелкоклеточного рака легкого. Оказалось, что в некоторых случаях он помогал очень хорошо, а в других случаях, наоборот, даже ухудшал прогноз для пациента. Генетические исследования опухолей тех и других типов пациентов позволили выяснить, что препарат помогает только в том случае, если в опухоли присутствует мутация в гене EGFR (кодирующего рецептор фактора роста), усиливающая экспрессию этого гена.
Подобный подход к лечению, включающий, например, генетический анализ индивидуальной опухоли, называется персонализированной медициной. Он помогает подобрать терапию для конкретного пациента, основываясь на его индивидуальных особенностях. Идеал, к которому стремятся исследователи-клиницисты, — это «цифровой двойник» пациента, математическая модель, которую можно создать, если вести подробную медицинскую карту в течение некоторого времени. Основное достоинство моделей в том, что они обладают предсказательными свойствами, то есть на основании данных для n пациентов можно сделать прогноз для n+1 пациента, болезнь которого протекает по схожему принципу (например, опухоль имеет ту же мутацию или обладает сходным морфологическим паттерном).
Для работы такой системы требуется очень большое количество данных о случаях, схожих с конкретным случаем пациента, систематизированных и максимально точно задокументированных для четкого и эффективного поиска закономерностей и вероятных направлений изменения состояния пациента как с течением времени, так и при применении определенных методов лечения. «Цифровой двойник», при должном обеспечении данными историй болезни и лечения, схожими со случаем конкретного пациента, может свести на нет ошибки в подборе лечения, минимизировать побочное действие различных видов терапии и ускорить лечение и реабилитацию пациента.
Для развития данного направления научная группа НЦМУ «Цифровой биодизайн и персонализированное здравоохранение» создала отдельную библиотеку оцифрованных скан-изображений гистологических препаратов почек в норме и с патологиями. Кроме того, при активном сотрудничестве с Институтом клинической морфологии ведется работа по созданию «цифровых двойников» пациентов на базе биоресурсной коллекции колоректального рака.
Если в онкологии наиболее значимыми данными можно считать морфологические и молекулярно-генетические характеристики опухолей, в кардиологии исследователи часто оперируют другими типами данных. Как мы уже писали выше, для анализа могут быть важны даже такие простые данные, как кровяное давление. Однако для корректной диагностики в клинике используют более сложные методы.
К примеру, для оценки вероятности развития ишемической болезни сердца измеряется разность давлений в двух участках коронарной артерии, чтобы определить, условно, насколько сильно она пережата. Этот показатель называется фракционный резерв кровотока, и обычно он измеряется инвазивно при помощи датчиков, которые вводятся в артерию. Современные технологии в теории позволяют делать это неинвазивно, при помощи компьютерной томографии высокого разрешения, что более безопасно и комфортно для пациентов. Однако для расчета рисков требуется хорошая модель, которую в настоящее время пытаются разработать сотрудники НЦМУ «Цифровой биодизайн и персонализированное здравоохранение» под руководством кардиолога Филиппа Копылова. Пока что исследователям удалось добиться хорошей корреляции с результатами инвазивного измерения и чувствительности метода в 67 процентах на данных выборки из 80 пациентов. Однако ученые надеются, что с увеличением выборки показатели их модели улучшатся и превзойдут результаты аналогичных моделей.
Тем не менее для решения задач кардиологии «традиционный» метод сбора образцов тоже очень важен. К примеру, анализ крови пациента позволяет определить концентрации холестерола и липопротеидов низкой плотности, превышение референсных значений для которых означает, что проблемы с сердцем, даже если они еще не развились, не за горами. С апреля 2022 года в Биобанке Сеченовского университета был запущен сбор образцов на платформах «Ревматология» и «Кардиология». Всего в рамках общеуниверситетского межклинического сбора менее чем за год было собрано более 30 тысяч образцов плазмы, сыворотки и цельной крови от более чем 4 тысяч пациентов.
Исследовательская группа Сеченовского Университета под руководством Петра Тимашева недавно опубликовала математическую модель метаболизма холестерола в клетках печени, которая позволяет предсказать эффекты двух самых распространенных препаратов, применяемых для контроля липидов в крови. Это статины, которые блокируют синтез холестерола, и ингибиторы фермента PCSK9, которые применяют для нормализации концентрации липопротеинов низкой плотности. Пока что модель валидна в in vitro системах, таких как плюрипотентные стволовые клетки или системы типа «орган-на-чипе». Однако анализ большого количества образцов от пациентов позволит добавить в модель новые параметры и в будущем частично автоматизировать процесс постановки диагноза и назначения лечения пациентам с сердечно-сосудистыми заболеваниями.
Персонализированная кардиология, к развитию которой стремятся исследователи из научного центра Сеченовки, подразумевает сбор как можно большего количества биохимических данных. Совокупность этих данных называется метаболом. Его ценность состоит в том, что он позволяет делать прогнозы для конкретного пациента по разным группам заболеваний, которые зачастую могут быть связаны. Самый очевидный пример — связь ожирения и сердечно-сосудистых заболеваний. Избыточный вес нередко приводит к развитию метаболического синдрома, при котором многие биохимические показатели крови нарушены. В первую очередь это высокая концентрация глюкозы, но кроме того, повышенная концентрация холестерола, о котором мы только что рассказывали в контексте проблем с сердцем.
Говоря о препаратах для терапии болезней сердца стоит упомянуть и генетический вклад в их переносимость. К примеру, на метаболизм статинов влияют однонуклеотидные полиморфизмы в генах цитохромов печени, которые «утилизируют» лекарства в организме. По некоторым данным, в России распространенность этих полиморфизмов в некоторых популяциях довольно велика, и это стоит учитывать для корректировки доз при назначении препаратов. Таким образом, генетический анализ тоже стоит принимать в расчет при создании «цифровых двойников» в кардиологии.
Тем не менее, генетический анализ не ограничивается поиском вариантов в ДНК. В последнее время все больший интерес исследователей вызывают так называемые некодирующие РНК, которые плавают в крови и регулируют множество процессов. Некоторые из этих молекул ассоциированы с теми или иными патологиями. Российские кардиологи и генетики из Сеченовского Университета в сотрудничестве со Сколковским научным центром показали, что две молекулы микроРНК, циркулирующие в крови, ассоциированы с развитием атеросклероза и могут служить маркерами для определения риска развития проблем с сердцем.
На первый взгляд может показаться, что персонализированная медицина требует значительного финансирования, сложных методов и приборов. Однако, если оценить перспективы «цифрового здравоохранения», можно заметить, что усилия, предпринятые сегодня, завтра позволят, напротив, сэкономить как время врачей, так и время и деньги самих пациентов.
Хорошо организованные системы хранения и обработки информации, компьютерные модели позволят более быстро и точно ставить диагнозы и назначать дозировки, а также избежать дополнительных анализов. Идеальное здравоохранение будущего опирается в том числе на развитую систему биобанков, куда человек сдавал бы кровь несколько раз в жизни, а на основе анализа изменений в биохимических показателях для него формировались бы рекомендации по образу жизни.
К чему-то подобному сейчас приходят в некоторых скандинавских странах. Самой первой на ум приходит Исландия, где компания deCODE, созданная по частной инициативе, собрала генетические данные почти у всех жителей страны. Это позволило ей разработать множество новых препаратов от ряда распространенных заболеваний, например ишемической болезни сердца и астмы. «Наш подход позволяет противостоять глобальным вызовам общественному здравоохранению», — говорят в самой компании. Так что отечественным исследователям уже есть с кого брать пример.
Сломанные хромосомы, клеточные бури и многоликие опухоли: что мы знаем о генетике рака сегодня
Еще не так давно ученые надеялись найти секрет победы над раком в изучении отдельных мутаций. Оказалось, однако, что изменения в геноме, превращающие обыкновенную клетку в раковую, многочисленны, сложны и разнообразны. Каждая опухоль — уникальная генетическая мозаика, а раковые клетки эволюционируют прямо в организме пациента. В этом материале мы поговорим о том, что новое понимание рака меняет для всех нас.