Не касаясь тела

Рассказываем, что такое большие данные с точки зрения медицины, и как они могут помочь поставить диагноз именно вам

В 2009 году известный журнал Timе в списке «идей, которые меняют мир прямо сейчас», упомянул биобанки. Это произошло всего через три года после запуска масштабного проекта UK Biobank, который к сегодняшнему дню стал источником данных для тысяч популяционных исследований, касающихся здоровья людей. Есть ли биобанки в России, как они связаны с персонализированной и цифровой медициной и какую пользу из них могут извлечь исследователи, а в перспективе и мы с вами, рассказываем вместе с Сеченовским Университетом.

В проекте «Биодизайн» вместе с Сеченовским Университетом мы рассказываем, как медицина становится все более персонализированной, зачем нам нужны биобанки и есть ли они в России, а также сможем ли мы отказаться от исследований на мышах, собаках и обезьянах.

Прочитайте эти два факта и попробуйте угадать, что их связывает:

1) Хроническое злоупотребление кофеином может стать причиной изжоги.

2) Вероятность заболеть ковидом в тяжелой форме выше, если вы живете один, чем если вы живете в семье.

Ответ — оба этих вывода сделаны в исследованиях, опирающихся на одну и ту же глобальную выборку цифровых медицинских карт под названием UK Biobank. Проект, который стартовал в 2006 году, уже собрал детальную информацию о 500 тысячах британцев в возрасте от 40 до 69 лет: что они едят и пьют, любят ли смотреть телевизор, сколько весят, сколько имеют детей, чем болеют и как лечатся.

Карты добровольцев, данные которых содержатся в банке в виде анонимных записей, кроме личных привычек, содержат довольно специальную информацию, такую как внутриглазное давление и генетические данные, собранные при помощи масштабных панелей однонуклеотидных полиморфизмов ДНК. Важная особенность этого биобанка в том, что данные о состоянии здоровья добровольцев продолжают собирать на протяжении всей их жизни (так называемое проспективное когортное исследование). К примеру, к 2017 году в картах участников было зафиксировано 1,3 миллиона госпитализаций, 40 тысяч человек из этой выборки заболели раком.

Эта масштабная база данных стала настоящим кладом для исследователей из разных областей медицины, генетиков и статистиков, которые ежедневно находят новые закономерности в том, как связана склонность к тем или иным привычкам, генетическая предрасположенность и состояние здоровья человека. Если в 2012 году на основе базы данных UK Biobank было опубликовано 13 научных работ, то в 2022 уже 486.

Британский биобанк стал таким ценным инструментом за счет двух преимуществ — большое количество участников и огромное число параметров, которые заносятся в персональные карты. Помимо пары упомянутых выше, у людей фиксировали множество других показателей здоровья, таких как состав тела, измеренный при помощи импедансометрии, электрокардиограмма в покое и при выполнении физических упражнений и так далее. Кроме того, эти карты содержат не только оцифрованные показатели здоровья, у добровольцев собирали также образцы крови, слюны и мочи. Таким образом, этот биобанк существует в том числе как физическое хранилище образцов, к каждому из которых привязана подробнейшая цифровая карта.

Зачем нужно было привлекать к этому проекту столько человек? Дело в том, что многие закономерности хорошо становятся видны лишь в масштабе. Наглядный пример приводит эпидемиолог из Оксфорда Томас Литтлджонс в своей статье о том, как биобанк помогает кардиологам. Сейчас связь высокого кровяного давления и вероятности развития сердечной ишемии кажется нам довольно очевидной, но в середине XX века, когда врачи впервые об этом задумались, это не было таким явным. Одно из первых подобных когортных исследований (Framingham Heart Study, проведенное в США) включало в себя 5 200 человек. Казалось бы, это довольно много, однако итоговые графики получились совсем не убедительными. Более того, из этих данных можно было сделать вывод, что в некоторых возрастных группах с увеличением кровяного давления смертность падает. Эффект стал куда более явным, когда подобный статистический анализ провели на выборке в 50 тысяч человек. Наконец, графики для выборки в полмиллиона человек не оставляют никаких сомнений, что, чем выше давление по сравнению с нормой, тем выше вероятность умереть раньше времени. Для врачей это значит, что для сохранения здоровья пациентам нужно обратить внимание на стратегии, нормализующие кровяное давление.

Разные типы биобанков

UK Biobank всего лишь самый крупный и знаменитый биобанк, в том числе благодаря своей «универсальности». Из-за большого числа параметров исследователи могут изучать совершенно разные показатели здоровья. Однако у него есть и серьезный недостаток: он является популяционным, то есть содержит биоматериал только коренных жителей Великобритании. По-хорошему, выводы, сделанные на этой выборке, можно распространять только на белых европейцев. Поэтому исследователи в каждой отдельной стране заинтересованы в создании национальных популяционных биобанков, которые содержали бы образцы и ассоциированную с ними информацию для представителей популяций, проживающих на территории данного государства или даже в географической области.

Примером такого биобанка можно назвать Биобанк народонаселения Северной Евразии, который был создан под руководством генетика Олега Балановского и к 2016 году насчитывал более 25 тысяч образцов из 274 этнических групп, проживающих на территории России и соседних стран. Генетический анализ этих групп позволяет не только установить закономерности, например, о родстве и темпах расселения разных народов, но и сделать интересные выводы, имеющие отношение к медицине. Например, в 2021 году генетики обнаружили, что один из маркеров, ассоциированных с вероятностью заболеть ковидом в тяжелой форме, встречается преимущественно в Западной Евразии.

Более распространены биобанки другого типа, которые называют нозологическими — они содержат биоматериал и записи о пациентах, страдающих конкретным заболеванием. Масштабный анализ образцов и медицинских карт в таких биобанках позволяет обнаружить новые маркеры заболевания, оптимизировать как диагностику, так и схемы лечения.

На сегодняшний день наиболее «продвинутыми» можно назвать онкологические биобанки, которые содержат образцы опухолей и биологические жидкости пациентов, страдающих различными типами рака. Прогноз и тип лечения в онкологии зачастую определяется молекулярно-генетическими особенностями опухоли, поэтому для полноты картины для каждого пациента важно исследовать панель генетических маркеров, а лучше полностью определить последовательность ДНК опухоли и здоровой ткани. К примеру, биобанк Международного агентства по исследованию рака Всемирной организации здравоохранения (IARC, International Agency for Research on Cancer) содержит более 5 миллионов образцов от более чем полумиллиона пациентов. Биобанк объединяет в себе около 50 отдельных исследовательских коллекций из разных стран и предоставляет услуги хранения образцов и выделения из них ДНК по строго стандартизованным протоколам. Сама организация IARC ведет свою историю с 1965 года и считает своей главной исследовательской задачей поиск веществ, вызывающих рак.

На базе ФГАОУ ВО Первый МГМУ им. И. М.Сеченова Минздрава России (Сеченовский Университет) в 2017 году был создан исследовательский нозологический биобанк, который играет роль репозитория Научного центра мирового уровня «Цифровой биодизайн и персонализированное здравоохранение». В рамках централизованного сбора образцов пациентов онкологического профиля из клиник Сеченовского Университета по проекту НЦМУ с 2021 года собрано более 11 тысяч образцов плазмы, сыворотки и цельной крови от более чем 1 600 пациентов. В коллекции представлены образцы от пациентов с новообразованиями кишечника, поджелудочной железы, почек, предстательной железы, мочевого пузыря, мягких тканей головы и шеи, молочной железы, средостения, легкого, забрюшинного пространства, половых органов, печени и др.

По словам директора Научно-технического парка биомедицины Сеченовского Университета Петра Тимашева, работа с образцами подразумевает не только их хранение, но и морфологический, иммуногистохимический и молекулярно-генетический анализ опухолей, а также сбор детальной информации о протекании заболевания у пациента, назначенную терапию и данные анализов.

От общего — к частному

Анализ данных от множества пациентов может помочь установить новые закономерности в терапии опухолей. В качестве примера можно привести случай с таргетным препаратом «Иресса», который в 2002 году проходил клинические испытания в качестве терапии немелкоклеточного рака легкого. Оказалось, что в некоторых случаях он помогал очень хорошо, а в других случаях, наоборот, даже ухудшал прогноз для пациента. Генетические исследования опухолей тех и других типов пациентов позволили выяснить, что препарат помогает только в том случае, если в опухоли присутствует мутация в гене EGFR (кодирующего рецептор фактора роста), усиливающая экспрессию этого гена.

Подобный подход к лечению, включающий, например, генетический анализ индивидуальной опухоли, называется персонализированной медициной. Он помогает подобрать терапию для конкретного пациента, основываясь на его индивидуальных особенностях. Идеал, к которому стремятся исследователи-клиницисты, — это «цифровой двойник» пациента, математическая модель, которую можно создать, если вести подробную медицинскую карту в течение некоторого времени. Основное достоинство моделей в том, что они обладают предсказательными свойствами, то есть на основании данных для n пациентов можно сделать прогноз для n+1 пациента, болезнь которого протекает по схожему принципу (например, опухоль имеет ту же мутацию или обладает сходным морфологическим паттерном).

Для работы такой системы требуется очень большое количество данных о случаях, схожих с конкретным случаем пациента, систематизированных и максимально точно задокументированных для четкого и эффективного поиска закономерностей и вероятных направлений изменения состояния пациента как с течением времени, так и при применении определенных методов лечения. «Цифровой двойник», при должном обеспечении данными историй болезни и лечения, схожими со случаем конкретного пациента, может свести на нет ошибки в подборе лечения, минимизировать побочное действие различных видов терапии и ускорить лечение и реабилитацию пациента.

Для развития данного направления научная группа НЦМУ «Цифровой биодизайн и персонализированное здравоохранение» создала отдельную библиотеку оцифрованных скан-изображений гистологических препаратов почек в норме и с патологиями. Кроме того, при активном сотрудничестве с Институтом клинической морфологии ведется работа по созданию «цифровых двойников» пациентов на базе биоресурсной коллекции колоректального рака.

Биобанкинг для кардиологии

Если в онкологии наиболее значимыми данными можно считать морфологические и молекулярно-генетические характеристики опухолей, в кардиологии исследователи часто оперируют другими типами данных. Как мы уже писали выше, для анализа могут быть важны даже такие простые данные, как кровяное давление. Однако для корректной диагностики в клинике используют более сложные методы.

К примеру, для оценки вероятности развития ишемической болезни сердца измеряется разность давлений в двух участках коронарной артерии, чтобы определить, условно, насколько сильно она пережата. Этот показатель называется фракционный резерв кровотока, и обычно он измеряется инвазивно при помощи датчиков, которые вводятся в артерию. Современные технологии в теории позволяют делать это неинвазивно, при помощи компьютерной томографии высокого разрешения, что более безопасно и комфортно для пациентов. Однако для расчета рисков требуется хорошая модель, которую в настоящее время пытаются разработать сотрудники НЦМУ «Цифровой биодизайн и персонализированное здравоохранение» под руководством кардиолога Филиппа Копылова. Пока что исследователям удалось добиться хорошей корреляции с результатами инвазивного измерения и чувствительности метода в 67 процентах на данных выборки из 80 пациентов. Однако ученые надеются, что с увеличением выборки показатели их модели улучшатся и превзойдут результаты аналогичных моделей.

Тем не менее для решения задач кардиологии «традиционный» метод сбора образцов тоже очень важен. К примеру, анализ крови пациента позволяет определить концентрации холестерола и липопротеидов низкой плотности, превышение референсных значений для которых означает, что проблемы с сердцем, даже если они еще не развились, не за горами. С апреля 2022 года в Биобанке Сеченовского университета был запущен сбор образцов на платформах «Ревматология» и «Кардиология». Всего в рамках общеуниверситетского межклинического сбора менее чем за год было собрано более 30 тысяч образцов плазмы, сыворотки и цельной крови от более чем 4 тысяч пациентов.

Исследовательская группа Сеченовского Университета под руководством Петра Тимашева недавно опубликовала математическую модель метаболизма холестерола в клетках печени, которая позволяет предсказать эффекты двух самых распространенных препаратов, применяемых для контроля липидов в крови. Это статины, которые блокируют синтез холестерола, и ингибиторы фермента PCSK9, которые применяют для нормализации концентрации липопротеинов низкой плотности. Пока что модель валидна в in vitro системах, таких как плюрипотентные стволовые клетки или системы типа «орган-на-чипе». Однако анализ большого количества образцов от пациентов позволит добавить в модель новые параметры и в будущем частично автоматизировать процесс постановки диагноза и назначения лечения пациентам с сердечно-сосудистыми заболеваниями.

Персонализированная кардиология, к развитию которой стремятся исследователи из научного центра Сеченовки, подразумевает сбор как можно большего количества биохимических данных. Совокупность этих данных называется метаболом. Его ценность состоит в том, что он позволяет делать прогнозы для конкретного пациента по разным группам заболеваний, которые зачастую могут быть связаны. Самый очевидный пример — связь ожирения и сердечно-сосудистых заболеваний. Избыточный вес нередко приводит к развитию метаболического синдрома, при котором многие биохимические показатели крови нарушены. В первую очередь это высокая концентрация глюкозы, но кроме того, повышенная концентрация холестерола, о котором мы только что рассказывали в контексте проблем с сердцем.

Говоря о препаратах для терапии болезней сердца стоит упомянуть и генетический вклад в их переносимость. К примеру, на метаболизм статинов влияют однонуклеотидные полиморфизмы в генах цитохромов печени, которые «утилизируют» лекарства в организме. По некоторым данным, в России распространенность этих полиморфизмов в некоторых популяциях довольно велика, и это стоит учитывать для корректировки доз при назначении препаратов. Таким образом, генетический анализ тоже стоит принимать в расчет при создании «цифровых двойников» в кардиологии.

Тем не менее, генетический анализ не ограничивается поиском вариантов в ДНК. В последнее время все больший интерес исследователей вызывают так называемые некодирующие РНК, которые плавают в крови и регулируют множество процессов. Некоторые из этих молекул ассоциированы с теми или иными патологиями. Российские кардиологи и генетики из Сеченовского Университета в сотрудничестве со Сколковским научным центром показали, что две молекулы микроРНК, циркулирующие в крови, ассоциированы с развитием атеросклероза и могут служить маркерами для определения риска развития проблем с сердцем.

Цифровая медицина как способ сэкономить

На первый взгляд может показаться, что персонализированная медицина требует значительного финансирования, сложных методов и приборов. Однако, если оценить перспективы «цифрового здравоохранения», можно заметить, что усилия, предпринятые сегодня, завтра позволят, напротив, сэкономить как время врачей, так и время и деньги самих пациентов.

Хорошо организованные системы хранения и обработки информации, компьютерные модели позволят более быстро и точно ставить диагнозы и назначать дозировки, а также избежать дополнительных анализов. Идеальное здравоохранение будущего опирается в том числе на развитую систему биобанков, куда человек сдавал бы кровь несколько раз в жизни, а на основе анализа изменений в биохимических показателях для него формировались бы рекомендации по образу жизни.

К чему-то подобному сейчас приходят в некоторых скандинавских странах. Самой первой на ум приходит Исландия, где компания deCODE, созданная по частной инициативе, собрала генетические данные почти у всех жителей страны. Это позволило ей разработать множество новых препаратов от ряда распространенных заболеваний, например ишемической болезни сердца и астмы. «Наш подход позволяет противостоять глобальным вызовам общественному здравоохранению», — говорят в самой компании. Так что отечественным исследователям уже есть с кого брать пример.