Представлены первые результаты работы над полным атласом клеток человека

Международный консорциум занимается им с 2016 года

Международный исследовательский консорциум представил первые результаты работы над черновым вариантом полного атласа всех человеческих клеток на всех этапах развития. Они включают концепцию проекта, используемые аналитические подходы и атласы отдельных органов. Посвященные этому публикации собраны в коллекцию журнала Nature, она продолжает пополняться.

Понимание того, как функционируют клетки организма в норме и при заболеваниях, важно в различных областях — от фундаментальной биологии до практической медицины. К настоящему времени картировано более 100 тысяч генетических вариантов, связанных с заболеваниями, однако в целом остается неизвестным, в каких клетках они активны и какие функции выполняют. При этом в организме человека, по оценкам, содержится 37,2 триллиона клеток различных типов и в различном состоянии, и на них влияет множество индивидуальных факторов, таких как происхождение, географическое положение, возраст, пол и многообразие пережитых событий.

Для выполнения амбициозной задачи по созданию современных референсных карт всех человеческих клеток в 2016 году был создан международный консорциум Human Cell Atlas (HCA), призванный использовать с этой целью достижения молекулярных исследований и машинного обучения. Открытую облачную платформу для него разработали сотрудники Европейского института биоинформатики, Броудовского института, фонда «Инициатива Чан — Цукерберга» и Калифорнийского университета в Санта-Крузе. В настоящее время в нем участвуют более 3600 исследователей из 102 стран, за время существования проекта они обработали данные более 100 миллионов клеток, полученных более чем у десяти тысяч людей.

После начального планирования члены HCA занялись сбором имеющейся информации по молекулярным профилям отдельных клеток, в основном транскриптомным, но также эпигеномным, протеомным и метаболомным. Для ее обработки исследователи консорциума разработали три модели на основе алгоритмов машинного обучения. Одна из них — popV — предназначена для классифицирования типов клеток путем переноса их меток из аннотированных атласов на неаннотированные датасеты. Другая — scTab — определяет типы клеток в различных тканях по данным секвенирования РНК отдельных клеток. Третья — MultiDGD — интегрирует мультимодальные данные, такие как экспрессия генов и доступность хроматина для транскрипции.

Сейчас HCA завершил первичный сбор данных и приступил к их интеграции для создания первого черновика атласа. В установочной статье создатели и сопредседатели консорциума Сара Тайхманн (Sarah Teichmann) из Кембриджского института стволовых клеток и Авив Регев (Aviv Regev) из биотехнологической компании Genentech с коллегами изложили свое видение развития атласа, состоящего из пяти этапов: как простой переписи клеток, как их масштабируемой трехмерной карты в структуре тканей и органов, как карты их трансформации в процессе развития (от эмбрионального до старения), как карты взаимовлияния генотипа и фенотипа с учетом людей разных этнических групп и происхождения и, наконец, как объединенной мультимодальной базовой модели, интегрирующей все эти уровни — по выражению авторов, аналога Google Maps для клеточной биологии.

В сопутствующих статьях члены 18 отдельных биологических сетей HCA описали результаты уже выполненных работ над отдельными частями атласа. Они включают атлас клеток кишечника в норме и при воспалении, атлас органоидов мозга на разных этапах развития, пространственный атлас клеток тимуса (вилочковой железы), мультиомный атлас плаценты с молекулярным разрешением, атлас внутриутробного развития скелета и пространственный клеточный атлас легких при фатальном ковиде у представителей черного африканского населения. Отдельная публикация посвящена этической стороне обработки данных — как сделать их максимально общедоступными и открытыми при различных путях получения (у живых людей, трупов, детей, представителей разных культур и этносов, на разных этапах развития и так далее).

Исследователи подчеркивают, что несмотря на революцию разрешающей способности генетических и молекулярных исследований и прогресс в области машинного обучения, работа над созданием атласа, позволяющего исследовать сложные механистические и функциональные аспекты биологии, будет очень непростой и потребует помимо прочего множественных экспериментов по внесению помех в нормальное функционирование клеток.

Ранее были представлены интерактивные атласы человеческих иммунной системы и анатомо-микроскопической структуры мозга, мультиомный атлас мозга приматов, атлас нейронов первичной моторной коры млекопитающих, атлас внутрисердечной нервной системы крысы, а также полный коннектом взрослой дрозофилы. Большинство из них выложены в открытый доступ.