Глубокое обучение привлекли к распознаванию образцов в гербариях

Ученые из Технологического института Коста-Рики представили метод автоматического распознавания растений по изображениям гербариев. Их алгоритм, созданный при помощи методов глубокого обучения, был обучен на 400 тысячах изображений растений, обитающих на территории Коста-Рики и Франции, может правильно идентифицировать растения в 90 процентах случаев. Статья с исследованием опубликована в журнале BMC Evolutionary Biology.

Сбор растений с целью их последующего высушивания используется ботаниками для систематического изучения растений уже несколько веков. В мире насчитывается около трех тысяч крупных гербариев в которых хранятся около 350 миллионов образцов различных растений, однако значительная их часть остается неопределенной. Алгоритмы для помощи исследователям в определении неизвестных видов растений уже давно разрабатываются: например, программа LeafSnap может определять растения с территории Северной Америки по снимку листа. Однако, все известные на сегодняшний день программы по автоматическому определению растений были разработаны с использованием небольших баз данных, из-за чего точность их работы сильно ограничена.

В своей новой работе исследователи представили алгоритм автоматического распознавания растений при помощи компьютерного зрения. Их технология создана на основе сверточной нейросети (англ. convolutional neural network, коротко CNN), которая отвечает за автоматическую обработку изображений с целью вычленить определенные характеризующие его паттерны (например, цвет или форму изображенного объекта).

Для тренировки и тестирования нейросети были использованы пять баз данных: две базы данных содержали отсканированные изображения растений из гербариев, две – изображения живых растений в природе и отсканированных листьев и еще одна база данных (один миллион изображений, взятых из ImageNet) была использована для предварительной тренировки и не связана с растениями. Всего исследователи собрали около 400 тысяч изображений более чем трех тысяч различных видов растений.

В результате, нейросеть, предварительно обученная только на изображениях гербариев, научилась определять растения по изображениям гербариев с точностью в 90 процентов. Предварительное обучение на базе данных изображений гербариев позволило нейросети определить изображение растений в поле с точностью 66 процентов. Кроме того, исследователи протестировали автоматическое определение растений на гербариях из одной местности (Франции) на базе данных гербариев другого региона (Коста-Рики): нейросеть научилась корректно решать такую задачу с точностью до 87 процентов.

Авторы отмечают важность использования методов глубокого обучения в решении задач компьютерного зрения вообще и идентификации биологических объектов в частности и надеются, что их работа поможет в разработке автоматических методов распознавания биологических особей in situ.

Компьютерное зрение помогает пользователям автоматически определять совершенно разные объекты. Например, приложение Smartify может определить картину по фотографии и предоставить о ней всю информацию, а недавно система распознавания лиц впервые помогла задержать преступника.

Елизавета Ивтушок

Нашли опечатку? Выделите фрагмент и нажмите Ctrl+Enter.