Данные от волонтеров помогли алгоритмам пересчитать пингвинов

Fiona Jones et al. / Scientific Data, 2020
Создатели проекта Penguin Watch, в рамках которого любой желающий может подсчитать антарктических пингвинов на снимках, использовали размеченные данные для создания двух алгоритмов, которые подсчитывают пингвинов автоматически. Первый, Pengbot, основан на алгоритме компьютерного зрения, а второй — на кластеризации по данным, размеченным волонтерами. В абсолютных цифрах второй алгоритм выигрывает у первого (он точнее), но эффективнее всего будет использовать оба: это позволит исключить ограничения волонтерского и компьютерного подсчета, пишут ученые в Scientific Data.
Несколько лет назад Фиона Джонс (Fiona Jones) из Оксфордского университета и ее коллеги организовали волонтерский проект Penguin Watch, в рамках которого установили 91 камеру для наблюдения за пингвинами в Антарктиде и на близлежащих островах. Обрабатывать снимки предложили всем желающим: на нескольких тысячах фотографий волонтеры отмечали взрослых пингвинов, птенцов и яйца. Всего наблюдатели рассмотрели 74 тысячи изображений, которые за ними потом проверили исследователи: оказалось, что волонтеры находят пингвинов в 96 процентах случаев (правда, испытывают трудности с тем, чтобы отличить птенца от взрослой особи).
Чтобы это проверить, для новой работы Джонс и ее коллеги разработали алгоритм Pengbot, основанный на сверточной нейросети — классически они используются для распознавания образов. Алгоритм обучали на 63 тысячах изображений с 14 разных камер, их разметили более 50 тысяч волонтеров. В свою очередь, данные, размеченные волонтерами, использовали для подсчета с помощью алгоритма кластеризации, основанном на методе ближайших соседей. Эта система учитывает передвижения пингвинов между снимками: если птица подвинулась на небольшое расстояние относительно тех, которые ее окружают, она распознается как одна особь, а если расстояние больше — считается другой птицей. В отличие от Pengbot, который пока что считает всех пингвинов без разбора, алгоритм кластеризации, основанный на волонтерских данных, различает взрослых особей и птенцов.
Гражданская наука довольно часто помогает исследователям оценивать численность особей в дикой природе. Нередко для этого используют и туристические фотографии: в прошлом году с помощью них, например, удалось подсчитать крупных хищников в Ботсване.
Елизавета Ивтушок