Международная команда ученых применила глубокое обучение для реконструкции прогрессии заболевания на клеточном уровне. Алгоритм, работающий на основе сверточной нейросети, научили распознавать и классифицировать клетки Т-лимфоцитов, а также визуализировать полный клеточный цикл. Классификацию клеток алгоритм выполняет с точностью до 98 процентов, что превосходит ранее созданные алгоритмы подобного рода. Статья опубликована в журнале Nature Communications.
Использование новейших компьютерных методов для анализа биологических данных может во многом улучшить, например, как диагностику заболевания, так и его изучение с целью выявить возможные способы лечения. Однако, такие методы требуют очень большого количества данных: например, чтобы проанализировать клеточный цикл или стадии заболевания, все этапы этих процессов должны быть известны и размечены. Методы глубокого обучения, в свою очередь, не требуют сложной и многоэтапной подготовки данных, и годятся для визуализации непрерывных биологических процессов.
Авторы новой работы применили глубокое обучение для создания метода реконструкции и визуализации клеточного цикла. Алгоритм работает на основе сверточной нейросети, которая получает на вход изображения, сделанные при помощи микроскопии, и дает на выходе классификацию каждой клетки и визуализацию процесса клеточного цикла. Особенностью работы алгоритма является то, что для работы нейросети необходимо разметить только небольшую часть данных, на основании чего она далее учится размечать самостоятельно.
Исследователи применили такой метод к анализу 32 тысяч Т-лимфоцитов, клеточный цикл которых состоит из семи этапов: трех частей интерфазы (периода роста) и четырех частей деления клетки – митоза (профаза, анафаза, метафаза и телофаза). Ученым удалось визуализировать непрерывный процесс всех трех этапов интерфазы и двух этапов митоза (последние два не удалось визуализировать ввиду небольшого количества данных). Анализ эффективности классификатора показал, что нейросеть правильно определяет клетку в 98,7 процентах случаев, в то время как ранее предложенный алгоритм, работающий на основе машинного обучения, показывал точность в 92,3 процента.
Ученые также испробовали созданный ими алгоритм для реконструкции прогрессии заболевания на примере диабетической ретинопатии – поражения сетчатки вследствие сахарного диабета. Для этого они использовали 30 тысяч изображений сетчатки здоровых людей или людей с диабетом в разной форме (легкая, средняя, тяжелая). Алгоритм, основываясь на использованных данных, построил визуализацию прогрессии заболевания.
Результаты работы нового алгоритма показывают возможность реконструкции биологических процессов с помощью методов глубокого обучения не только для анализа клеточного цикла, но и для изучения прогрессии заболевания. Кроме того, ученые утверждают, что одним из основных достоинств их метода является скорость – алгоритм может анализировать до тысячи клеток в секунду.
В медицинских и биологических исследованиях часто применяются различные методы машинного обучения. Например, в нашей заметке вы можете узнать о том, как автоматический анализ изображений помогает выявить меланому. В другой нашей заметке вы можете прочитать о том, как глубокое обучение помогает распознавать образцы растений в гербариях.
Елизавета Ивтушок