Компьютер смог распознать мышиные песни c человеческой точностью

Biodiversity Heritage Library / flickr

Австрийские ученые разработали алгоритм, автоматически определяющий мышиное пение на аудиозаписи. Он позволяет проводить анализ песен почти на порядок быстрее, чем вручную, при этом точность обработки данных сопоставима с ручным анализом. Кроме того, новый алгоритм распространяется бесплатно. Статья опубликована в журнале PLoS ONE.

В основном мышиные песни имеют высокую частоту (от двадцати до ста двадцати килогерц), что делает их трудно различимыми для человеческого слуха, при этом они не менее сложны, чем привычные для нас птичьи песни. Мышата начинают петь еще в детстве, когда остаются в одиночестве и пытаются привлечь ушедшую мать, а взрослые мыши используют сложную ультразвуковую вокализацию (USV) в периоды различных социальных взаимодействий. Например, мужские особи активно поют в присутствии самки, во время ухаживания и спаривания. Интерес к исследованию мышиных песен в последнее время возрос, в первую очередь благодаря техническим достижениям в биоакустическом анализе.

Разработка методов автоматического распознавания и анализа USV представляет собой непростую техническую задачу из-за большого размера звуковых файлов и низкого отношения сигнал/шум. Обычно исследователи полагаются на ручной анализ звуков на спектрограммах, что требует много времени. Иногда ученые используют скрипты для полуавтоматического распознавания или коммерческое программное обеспечение, например, Avisoft SAS LabPro или Sound Analysis Pro. Частота ошибок при использовании этих программ, по словам авторов статьи, обычно не указывается, и их надежность вызывает сомнения. Поэтому ученые разработали новый алгоритм для анализа USV и сравнили частоту допускаемых ошибок при анализе, проводимом различными способами.

Исследования проводились над домашними мышами (Mus musculus musculus), потомками мышей, пойманных в Институте Этологии Конрада Лоренца. Мыши выращивались в небольших разнополых группах до трехнедельного возраста, затем их разделяли. Мужские особи содержались отдельно для предотвращения драк, женские — в парах. Во всех клетках было достаточно древесной стружки и гнездового материала, количество еды и воды не ограничивалось (ad libitum). Всего в эксперименте участвовало тридцать две взрослые мыши возрастом около 190 дней — одиннадцать мужских и двадцать одна женская особь. Ни одна мышь в ходе исследования не пострадала.

Ученые записали песни одиннадцати самцов и трех самок в присутствии стимула (женской особи) во время периода вечерней активности мышей. В каждом случае «певец» (caller) не был знаком со стимулом, поскольку они росли в разных группах. Обе мыши помещались в клетку, разделенную на две равные части пластинкой из плексигласа, в которой были проделаны небольшие отверстия. Половина с «певцом» накрывалась металлической крышкой, а со стимулом — плексигласовой, хорошо поглощающей ультразвук. Затем клетка помещалась в звукозаписывающую камеру. В десяти сантиметрах от крышки «певца» располагался конденсаторный ультразвуковой микрофон с диапазоном частот от 10 до 200 килогерц. Запись велась в течение десяти минут с частотой дискретизации 300 килогерц, в 16-битном формате.

Затем на основе анализа записей ученые разработали алгоритм для выделения промежутков с пением из общего массива данных. Обычно это сложно делать в автоматическом режиме из-за маскировки ультразвуковых сигналов посторонними шумами. Здесь авторы предложили новый метод отделения полезного сигнала от шума, который использует то факт, что отдельные слоги мышиной песни имеют небольшую спектральную ширину и значительно бо́льшую высоту, чем фоновый шум. Процесс обработки был разбит на три шага. В первом производилась предварительная очистка звука от шума с помощью обрезания наименее высоких частот на коротком фрагменте записи (порядка миллисекунды). На втором шаге порог частоты на этом фрагменте уточнялся. Наконец, количество энергии, содержащейся в оставшихся частотах, сравнивалось с определенным пороговым значением, и на основании этого сравнения принималось решение, отнести фрагмент записи к пению или шуму. Затем последовательные фрагменты одной природы объединялись, так что получались отдельные слоги мышиных песен, доступные для дальнейшего анализа учеными.

Наконец, исследователи провели ручной анализ четырех записей и подобрали такие параметры, при которых алгоритм максимально четко отделял песни от фонового шума. После этого они сравнили на оставшихся десяти записях работу существующих на данный момент программ и нового алгоритма. Оказалось, что число ложноположительных и ложноотрицательных срабатываний у него гораздо меньше: 10 процентов против 40 и 20 против 50 соответственно. По словам авторов, он работает почти так же хорошо, как ручной анализ, только в 4-12 раз быстрее в зависимости от размера файла.

Изучение мышиных песен особенно интересно из-за их сложности и разнообразия, однако простой ручной анализ звуковых записей требует много времени — до трех часов для десятиминутного фрагмента. Разработанный исследователями алгоритм распространяется бесплатно и позволяет ученым производить относительно надежный и быстрый анализ мышиного пения. Правда, в некоторых случаях автоматическое детектирование работает не так уж хорошо, например, при физическом взаимодействии зверьков, когда они спариваются или дерутся. Сейчас ученые работают над совершенствованием своего алгоритма.

Мы уже писали про ультразвуковые песни мышей. Оказалось, что они интересны не только своей сложностью, но и механизмом производства звуков — он напоминает работу реактивного двигателя при вертикальном взлете.

Дмитрий Трунин

Нашли опечатку? Выделите фрагмент и нажмите Ctrl+Enter.