Для этого генетики отредактировали мышиный геном 80 тысяч раз
Американские, британские и датские биологи предложили способ, как повысить ценность полногеномного анализа ассоциаций. Они создали культуру хрящевых клеток мыши, выключили в них при помощи системы CRISPR/Cas9 по одному из почти 20 тысяч известных генов, и сравнили данные о созревании хондробластов in vitro с популяционно-генетическими данными о детерминантах роста человека. Сопоставление созревания 780 миллионов клеток и данных GWAS о росте пяти миллионов человек показало, что два метода дополняют друг друга в выявлении генов, влияющих на развитие скелета. Исследование опубликовано в журнале Cell Genomics.
Полногеномный анализ ассоциаций (genome-wide association studies, GWAS) позволяет статистически связать какой-либо признак организма с набором полиморфизмов в геноме. Для некоторых количественных признаков, например, изменений на ЭКГ, ассоциированных со внезапной смертью, удается идентифицировать набор из нескольких десятков SNP при помощи GWAS. Такими данными впоследствии можно пользоваться в медицинской генетике.
С другими количественными признаками ситуация обстоит сложнее – особенно если GWAS проведен на большой и этнически разнообразной группе людей. В 2022 году консорциум GIANT опубликовал препринт статьи, где описаны результаты GWAS, посвященного росту людей, на выборке более чем из пяти миллионов человек. В исследовании было идентифицировано более 12 тысяч SNP, связанных с ростом. Авторы сделали вывод, что на этот антропометрический признак влияет примерно 20 процентов генома. Применение алгоритмов ранжирования SNP в зависимости от биологической роли тех или иных участков генома не позволяет кардинально сузить этот массив данных. Такого рода результаты неприменимы в реальной жизни, и это слабое место GWAS.
Группа молекулярных биологов из нескольких университетов Дании, Великобритании и США под руководством Норы Рентал (Nora E. Renthal) из Гарвардской медицинской школы при участии GIANT решила добавить еще одно логическое звено в исследование геномики роста, а именно, оценить in vitro влияние каждого отдельного гена на развитие скелета и сопоставить такие данные с результатами GWAS.
Рост скелета человека определяется в первую очередь ростом трубчатых костей – точнее, ростом хрящей, образующих эпифизарные пластинки роста. Когда под действием половых гормонов происходит созревание хрящевой ткани и окостенение пластинок роста, рост трубчатых костей в длину замедляется, а затем и прекращается. Таким образом в первом приближении процесс роста скелета можно свести к делению и созреванию клеток хрящевой ткани.
Ученые создали линию мышиных хондробластов, экспрессирующих Cas9-эндонуклеазу, и параллельно синтезировали библиотеку из 79,6 тысяч CRISPR-РНК для "выключения" кодирующих участков генома мыши - в среднем по четыре гидовых последовательности на каждый из известных 19,9 тысяч мышиных генов.
После трансдукции клеток вирусом, содержащим одну из CRISPR, ученые получили культуру, в которой были представлены хондробласты, нокаутные по любому из известных генов. На четвертый и пятнадцатый день после трансдукции они оценивали выраженность экспрессии на клетках белка CD200, маркера созревания хондроцитов (на обеих временных отметках было проанализировано по 300 миллионов клеток). Биологи провели мРНК-секвенирование 10 процентов самых быстросозревающих и 10 процентов самых медленносозревающих клеток, чтобы установить, клоны с какими гидовыми РНК представлены в двух группах. В сумме было выявлено 140 клонов клеток, влияющих на созревание хрящевой ткани с достоверностью на уровне p < 0,001. Примерно каждый четвертый клон был мутантом по генам, чьи продукты участвуют в работе сигнальных путей, связанных с развитием хрящей.
Далее ученые сопоставили данные теста с мета-анализом двух GWAS, проведенных консорциумом GIANT в 2018 и 2022 годах и включавших около 5,5 миллионов людей из разных этнических групп. В этих сводных биологи выявили 228 генов, чье влияние на экспрессию CD200 было достоверно на уровне p < 0,01 и при этом приоритизированных по результатам GWAS. И через четыре дня, и через 15 дней после трансдукции в группе ускоренного созревания были широко представлены нокауты по генам, которые приоритизировал GWAS, но результаты из более ранней временной точки лучше сошлись с человеческими популяционными данными.
Были отобраны 140 генов, показавшие в первой части эксперимента связь со скоростью созревания хондроцитов на уровне p < 0,001, и еще 22 гена с более низкой достоверностью связи (p < 0,01), но приоритизированные в GWAS. С этими генами авторы повторили эксперимент, взяв более подробную библиотеку CRISPR с покрытием в 10 гидовых РНК на ген (в сумме еще по 90 миллионов клеток на каждую временную отсечку). В 145 случаях из 162 экспрессия CD200 после трансдукции менялась так же, как и в первой части эксперимента.
Таким образом, исследование доктора Рентал с коллегами показывает, как сочетание GWAS и геномного редактирования позволяет в разы сократить количество кандидатных локусов при исследовании количественных признаков. Важно, что такой подход можно успешно применять только к процессам, с понятной и единообразной патогенетической цепочкой, которую можно массово воспроизвести на отдельных клетках in vitro, а создание нокаутных клеточных линий – довольно грубый способ манипуляции экспрессией генов.
Вместе с тем, отмечают авторы исследования, им удалось обнаружить несколько новых кандидатных генов, ранее не исследованных в контексте развития скелета (в частности, Det1). Такие случайные находки могут открыть путь для обнаружения новых сигнальных каскадов или способов манипуляции ими.
Генетические big data используют не только для оценки количественных признаков, но и для объяснения сложных поведенческих феноменов, например, гомосексуальности или интеллекта.