Пятого сентября в журнале Proceedings of the National Academy of Sciences была опубликована новая работа коллектива под руководством Крейга Вентера — человека, который первым отсеквенировал геном человека, создал «искусственную клетку» и организм с минимальным геномом. Сделал Вентер это все, конечно, не один, а силами целого института имени себя. В новой статье сотрудники его компании Human Longevity, Inc. утверждают, что по последовательности ДНК можно реконструировать внешний вид человека. Статья вызвала в научном сообществе дискуссию, о которой рассказал Nature.
Авторы статьи разработали алгоритм, который по геномным данным предсказывает цвет кожи и глаз, форму лица, рост человека, его индекс массы тела, высоту голоса, возраст и пол. Для этого ученые проделали титаническую работу и полностью определили последовательности геномов 1061 человека разного возраста и национальности. Используя данные об однонуклеотидных полиморфизмах, ассоциированных с теми или иными признаками, и трехмерные снимки участников проекта, исследователи обучили алгоритм связывать геномные данные с фенотипическими признаками. В результате авторам удалось по последовательности ДНК идентифицировать личность из случайной группы в 10 человек с вероятностью 74 процента.
Главным выводом статьи является утверждение, что персональные данные людей, которые пользуются услугами генетических сервисов или участвуют в масштабных генетических исследованиях, должны быть защищены. В настоящее время многие базы данных по генетике человека находятся в свободном доступе. К примеру, на сайте проекта «Тысяча геномов» все данные можно беспрепятственно скачать, а сам проект на самом деле уже насчитывает две с половиной тысячи геномов. Ученые по всему миру используют результаты этого и других подобных проектов для поиска закономерностей в области организации и работы генома. Поэтому вопрос публичного доступа к базам данных волнует не только Крейга Вентера.
Буквально на следующий день после выхода статьи на сайте BioRxiv появился препринт критической статьи, автор которой, Янив Эрлих (Yaniv Erlich) из Колумбийского университета Нью-Йорка, утверждает, что команда Вентера сильно переоценивает значимость своих результатов. Эрлих продемонстрировал, что подобной точности в «идентификации» можно добиться, зная только пол, возраст и национальность людей, и никаких генетических данных для этого не нужно. Он обеспокоен тем, что статья Вентера может привести к ужесточению правил по использованию генетических данных исследователями и ограничению доступа к базам данных. Кроме того, Вентера обвиняют в личной заинтересованности в ограничении доступа, так как его компания сама занимается сбором данных и, вероятно, собирается делать на этом деньги.
Интересно, что Эрлих сам одним из первых заговорил о возможности идентификации личности по опубликованному геному — в 2013 году его команда выпустила в Science статью, в которой показала, что по последовательности Y-хромосомы можно узнать фамилию участника исследования. Для этого нужно воспользоваться сервисом, который строит генеалогические деревья.
Пару дней назад дискуссия вышла на новый уровень — команда Вентера опубликовала на BioRxiv ответ Эрлиху, в котором последовательно разбирает его критику и доказывает, что она несостоятельна. Кроме того, авторы акцентируют внимание на том, что при помощи их алгоритма можно предсказать множество характеристик, а не только внешность. Научное сообщество, затаив дыхание, ждет, что на это ответят критики. Тем временем российское Федеральное агентство научных организаций (ФАНО) уже объявило конкурс стоимостью 1,29 миллиарда рублей на разработку подобной технологии «в рамках импортозамещения». На сегодняшний день это крупнейший грант в сфере ДНК-исследований в России.
Казалось бы, законопослушным гражданам никакого вреда технология «восстановления внешности по геному» причинить не может. Тогда за что же так ратует Крейг Вентер? Скорее всего, главная цель его статьи — продемонстрировать, как много информации можно извлечь из последовательности ДНК. К примеру, возможность недобросовестного использования страховыми компаниями персональных данных о предрасположенности к заболеваниям обсуждается уже давно. Идентификация личности пациента в персонализованной медицине может привести к нарушению врачебной тайны. Легко представить, как такая информация может быть использована в маркетинговых целях. Так что, несмотря на возмущение отдельных ученых, статья скорее всего достигнет своей цели и подстегнет разработку законодательства в области ДНК-исследований.