Новый компьютерный алгоритм SCENIC реконструирует генную регуляторную сеть и распознает состояние одиночной клетки. Использование разработанной бельгийскими учеными программы позволило различить отдельные типы раковых клеток в олигодендроглиоме и меланоме. Статья опубликована в журнале Nature Methods.
Процесс синтеза РНК в клетке зависит от сети регуляции генов , в которой ограниченное количество факторов транскрипции и кофакторов регулируют друг друга и синтезируемые гены. Синтезируемые белки определяют работу различных клеток организма, что позволяет распознавать и отличать их. Всего было разработано несколько методов, позволяющих определить из данных секвенирования РНК отдельной клетки, какие белки ей производятся, но эти методы не использовали анализ регуляторной последовательности для прогнозирования взаимодействия между факторами транскрипции и целевыми генами. В новом алгоритме эти связи учитываются.
Строго говоря, SCENIC (расшифровывается как Single-CEll regulatory Network Inference and Clustering, распознавание и кластеризация регуляторной сети отдельной клетки) — это не отдельная программа, а рабочий процесс, основанный на использовании трех новых пакетов проекта Bioconductor. Первый из них, GENIE3, определяет потенциальные целевые факторы транскрипции на основе коэкспрессии. Второй, RcisTarget, ищет наиболее важные факторы и определяет прямые цели анализа (регулоны). Наконец, третий, AUCell, оценивает активность регулонов в отдельных клетках. Также ученые использовали инструмент GRNBoost в качестве альтернативы GENIE3 на больших наборах данных. Подробную документацию всех перечисленных программ, а также исходный код и обучающие руководства можно найти на сайте проекта.
Чтобы оценить работу алгоритма, ученые протестировали его на данных секвенирования РНК хорошо изученных клеток мышиного мозга. Программа выявила из 1046 исходных модулей коэкспрессии 151 регулонов. Оценивая активность регулонов, ученые выявили ожидаемые типы клеток вместе со списком потенциальных основных регуляторов для каждого типа. Более того, кластерный анализ по типу клетки оказался точнее, чем у многих специализированных методов кластеризации отдельных клеток.
Также исследователи применили SCENIC для определения состояний клеток в наборе данных, полученных РНК-секвенированием 4043 клеток олигодендроглиомы (взятых из шести различных опухолей) и 1252 клеток меланомы (взятых из 14 поражений). Из-за мутаций клеток, специфичных для опухолей, и сложных хромосомных аберраций распознавание состояний раковых клеток оказалось более сложным, чем для случая нормальных клеточных состояний. Обычный кластерный анализ позволяет установить только тип ткани, из которой была взята раковая клетка, но SCENIC разглядел более сложную картину. Для олигодендроглиомы он обнаружил три различных типа клеток, для меланомы — два.
С помощью разработанного учеными алгоритма можно будет построить более точную карту клеток человеческого тела. Также он поможет лучше понять процессы, управляющие производством и активностью различных типов клеток, и позволит эффективнее распознавать различные виды рака.
Ранее мы писали о том, как цифровой анализ изображений и машинное обучение помогли в ранней диагностике меланомы.
Дмитрий Трунин
Microsoft подтвердила, что уже некоторое время использует алгоритм в Bing
Компания OpenAI представила генеративную языковую модель GPT-4. Новая версия модели получила более высокие результаты в бенчмарках, причем не только на английском языке. Также алгоритм научился принимать не только текст, но и изображения (но генерирует он по-прежнему лишь текстовые ответы). Наконец, GPT-4 лучше определяет опасные и дискриминирующие запросы, например, просьбу написать инструкцию по сборке бомбы. OpenAI открыла ограниченный доступ к GPT-4 подписчикам ChatGPT Plus, а также открыла прием заявок на доступ к API, но в обоих случаях речь идет о версии модели без поддержки изображений. Описание GPT-4 опубликовано на сайте OpenAI, а также доступно в виде научной статьи.