Исследователи разработали систему искусственного интеллекта, которая позволяет с высокой точностью диагностировать 216 редких наследственных заболеваний по фотографии. Как сообщается в Nature Medicine, ее научили распознавать генетическое расстройство (выбирать из 10 самых вероятных вариантов) 91-процентной точностью. Ученые также упростили примение системы на практике: они создали мобильное приложение для медиков, которое позволяет определить генетическое расстройство по фотографии пациента.
Диагностировать наследственное заболевание зачастую бывает сложно. Существует несколько тысяч болезней, связанных с генетическими нарушениями, большинство из которых встречается крайне редко. Многие врачи за время своей практики могут просто не столкнуться с подобными заболеваниями, поэтому референтная компьютерная система, которая помогала бы распознавать редкие наследственные заболевания, облегчила бы диагностику. Исследователи уже создавали подобные системы, основанные на распознавании лиц, но они умели определять пока что не более 15 генетических расстройств, при этом точность распознавания нескольких заболеваний не превышала 76 процентов. Кроме того, подобные системы иногда не могли отличить больного человека от здорового. При этом обучающая выборка, часто не превышала 200 фотографий, что слишком мало для глубокого обучения.
Поэтому американские, германские и израильские ученые и сотрудники компании FDNA под руководством Ярона Гуровича (Yaron Gurovich) из Тель-Авивского университета разработали систему распознавания лиц DeepGestalt, которая позволяла диагностировать несколько сотен заболеваний. Используя сверточные нейронные сети, система разделяет лицо на отдельные фрагменты размерами 100×100 пикселей и предсказывает вероятность каждого заболевания для того или иного фрагмента. Затем вся информация суммируется и система определяет вероятное расстройство для лица в целом.
Исследователи обучили систему отличать конкретное наследственное заболевание от ряда других. Для обучения они использовали 614 фотографий людей, страдающих синдромом Корнелии де Ланге — редкого наследственного заболевания, которое проявляется, в том числе, в виде умственной отсталости и врожденных пороков внутренних органов. В качестве отрицательного контроля авторы использовали более тысячи других изображений. DeepGestalt различала синдром Корнелии де Ланге от других заболеваний с точностью 97 процентов (p=0,01). Авторам других исследований удалось добиться точности 87 процентов, в то время как эксперты ставили корректный диагноз, в среднем, в 75 процентах случаев. В другом эксперименте ученые использовали 766 фотографий больных синдромом Ангельмана («синдром Петрушки»), для которого, в том числе, характерны хаотические движения, частый смех или улыбки. Система распознавала заболевание с точностью 92 процента (p=0,05); в предыдущем исследовании точность определения составляла 71 процент.
Также исследователи научили систему распознавать разные типы одного и того же наследственного заболевания на примере синдрома Нунан. Известны несколько типов этого расстройства, каждый из которых вызван мутациями в определенном гене и у каждого есть небольшие отличия в чертах лица (например, редкие брови). С помощью выборки в 81 фотографию, авторы статьи научили систему DeepGestalt различать пять типов этого заболевания с точностью 64 процента (p<1×10-5).
Всего для обучения системы ученые использовали суммарно 17106 фотографий, представляющих 216 наследственных заболеваний. Эффективность работы DeepGestalt исследователи проверили на 502 фотографиях пациентов, которым уже поставили диагноз, и, на другой выборке из 329 фотографий пациентов с известным диагнозом из Лондонской медицинской базы данных. Система определяла заболевание пациента из 10 самых вероятных вариантов с точностью 91 процент (p<1×10-6).
Исследователи также облегчили примение DeepGestalt на практике — они создали платформу для диагностики наследственных заболеваний по фенотипу, а также мобильное приложение для медиков Face2Gene, с помощью которого врач может поставить диагноз своему пациенту.
В прошлом году исследователи создали систему автоматического распознавания растений по их изображениям в гербариях. Сверточная нейросеть научилась определять растения с 90-процентной точностью.
Екатерина Русакова