Итальянцы научили компьютер анализировать наблюдения за животными

Итальянские разработчики представили алгоритм, который автоматически соотносит отдельные временные отрезки наблюдений за деятельностью животных с описанием их поведения. Предложенный метод опробовали на данных, полученных в ходе наблюдений за павианами: точность классификации поведения составила 78 процентов. В будущем это может существенно облегчить исследования поведения животных в дикой природе, пишут ученые в препринте на arXiv.org.

Исследования поведения животных очень важны для понимания не только особенностей их жизни, но и возможных путей протекания эволюционных процессов. Разумеется, намного эффективнее для таких исследований изучать животных в их естественной среде обитания (это сильно повышает валидность полученных данных), но для этого нужно использовать дополнительные инструменты: ярлычки для отдельных особей, GPS-трекеры, системы компьютерного зрения и другие методы.

При этом использование таких технологий — не самая сложная задача, но собранные данные затем необходимо обработать, а это часто требует разметки вручную. Исследователи из Миланского технического университета под руководством Гуидо Мускиони (Guido Muscioni) предложили способ, который позволит соотнести сырые данные, собранные с помощью регистрирующих устройств in situ, c наблюдаемым поведением автоматически. Они разработали алгоритм, основанный на статистическом анализе временных рядов — изменении наблюдаемой переменной в определенные периоды относительно времени исследования и тех явлений, которые изучаются. 

Чтобы протестировать полученный алгоритм, ученые использовали данные о перемещениях группы из 35 павианов, собранные в течение 26 дней наблюдений. В датасете, помимо самих наблюдений, также содержалась информация о восьми видах деятельности животных, и данные активности были размечены относительно временных отрезков для двух дней из 26. При временном отрезке в одну минуту точность классификации деятельности павианов составила почти 78 процентов, что на 10 процентов превосходит, к примеру, метод классификации временных рядов, основанный на работе рекуррентных нейросетей.

Авторы пришли к выводу, что предложенный ими метод может качественно классифицировать поведение животных в естественной среде обитания по измерениям относительно времени. В будущем исследователи планируют улучшить свой алгоритм, используя другие датасеты с данными, полученными с помощью других наблюдений.

Другая важная биологическая задача, которую можно решить автоматически, — это идентификация отдельных видов. Прошлым летом был опубликован датасет для распознавания животных и растений iNat2017: в нем содержится 859 тысяч фотографий, сделанных с помощью приложения iNaturalist.

Елизавета Ивтушок