Cозданная нейросетью система CRISPR-Cas9 отредактировала геном человеческих клеток

Ее выложили в открытый доступ

Американские исследователи представили первый нейросетевой инструмент для создания полностью искусственных систем редактирования генома CRISPR-Cas9. Одну из них успешно испытали на человеческих клетках и выложили в открытый доступ, говорится в пресс-релизе компании Profluent. Препринт публикации о создании инструмента, получившего название OpenCRISPR, доступен на ресурсе bioRxiv.org, коротко о нем рассказано на сайте проекта.

Создание систем редактирования генома на основе микробных CRISPR-связанных ферментов, таких как SpCas9, открыло новые перспективы в молекулярной биологии, медицине, сельском хозяйстве и биотехнологиях. Тем не менее природные бактериальные системы, оказываясь в неестественных для них условиях эукариотических клеток, обладают значимыми функциональными недостатками — в первую очередь недостаточной эффективностью редактирования, действием вне заданной мишени и невысокой стабильностью. Это заставляет искать новые варианты системы CRISPR-Cas в микроорганизмах или оптимизировать имеющиеся для практического применения, а это долгий и трудозатратный процесс.

Чтобы упростить его, Али Мадани (Ali Madani) с коллегами из компании Profluent задействовали большую языковую модель (LLM) ProGen2, созданную ими ранее для нейросетевого дизайна белковых молекул. Для этого они провели систематический сбор данных среди 26,2 триллиона пар оснований собранных микробных геномов и метагеномов из разных родов и биомов. Это позволило выявить почти миллион с четвертью оперонов CRISPR-Cas разных типов (самый большой их датасет в настоящее время, названный CRISPR-Cas Atlas), включающих эндонуклеазы Cas, последовательности CRISPR, транс-активирующие CRISPR-РНК (tracrРНК) и прилежащие к протоспейсеру мотивы (PAM).

После этого языковую модель на основе ProGen2 настроили на работу с CRISPR-Cas Atlas и с ее помощью сгенерировали четыре миллиона последовательностей, сбалансированных по семействам белков и размеру кластеров (на это ушло три дня с использованием 16 графических процессоров). Их распределили по типам CRISPR-Cas и отсеяли заведомо нефункциональные варианты с помощью инструментов BLAST и HMM. Сопоставление с природными CRISPR-Cas с помощью MMseqs2 показало, что сгенерированные последовательности расширили разнообразие в 4,8 раза. Большинство этих последовательностей совпадали с ближайшей природной лишь на 40–60 процентов, однако их конформация, рассчитанная AlphaFold2, оказалась близкой, что свидетельствовало о потенциальной функциональности. Дальнейшие эксперименты с избранным количеством последовательностей и более точными инструкциями для модели позволили получить разнообразные полноценные эффекторы CRISPR-Cas II типа с совместимыми гидовыми РНК (гРНК).

Чтобы получить Cas9-подобные белки для экспериментальной характеризации, исследователи применили ограниченную стратегию генерирования с использованием либо N-концевых, либо C-концевых последовательностей природного SpCas9, чтобы обеспечить аналогичную с ним совместимость с PAM и гРНК. Для функционального анализа выбрали 209 сгенерированных Cas9-подобных белков. Содержащими их плазмидами и плазмидами с гРНК SpCas9, нацеленными на три известных участка ДНК, трансфицировали человеческие клетки иммортализованной линии HEK293T. Часть Cas9-подобных белков продемонстрировала эффективность, сопоставимую с или превосходящую SpCas9. После этого аналогичный опыт провели с использованием 48 полностью (включая N-концевые и C-концевые последовательности) сгенерированных Cas9-подобных белков, и многие из них показали высокую эффективность и специфичность.

Наилучший из них — PF-CAS-182 — по он-таргетной эффективности был сопоставим с SpCas9, обладая при этом гораздо большей специфичностью (уровень офф-таргетного редактирования ниже на 95 процентов). Его последовательность совпадала с SpCas9 на 71,7 процента. После успешных испытаний на широком спектре геномных мишеней этот белок назвали OpenCRISPR-1 и выложили его последовательность в открытый доступ, призывая всех желающих использовать и тестировать его, снабжая разработчиков обратной связью. Более того, OpenCRISPR-1 совместили со сгенерированными языковой моделью адениндеаминазами и получили функциональную систему редактирования азотистых оснований, эффективно заменяющую аденин на гуанин в заданных участках ДНК.

Сотрудники Profluent выразили готовность сотрудничать с коллективами, которые нуждаются в оптимизации OpenCRISPR-1 для конкретных прикладных задач. Они также отметили, что в соответствии с этическими стандартами лицензия на технологию предусматривает некоторые ограничения — например, запрет редактирования клеток зародышевой линии.

В ноябре 2023 года Великобритания стала первой страной мира одобрившей клиническое применение терапии с использованием CRISPR. Препарат применяется ex vivo для лечения наследственных анемий. Вскоре такое же решение приняли США и месяц спустя лицензировали применение этого препарата по второму показанию.

Нашли опечатку? Выделите фрагмент и нажмите Ctrl+Enter.
Представлены первые результаты работы над полным атласом клеток человека

Международный консорциум занимается им с 2016 года