Российские ученые совместно с ИТ-специалистами представили интеллектуальную систему, способную выделять волчий вой среди множества звуков, издаваемых животными. Разработка стала результатом сотрудничества Сбера, Института проблем экологии и эволюции РАН и Института истории естествознания и техники РАН. Технологию впервые представили в Москве на конференции AI Journey.
В основе системы лежит аудиомодификация трансформерной нейросети AST. Для обучения использовали почти девять часов звуков, характерных для волков, а также свыше 200 часов акустических фрагментов с голосами других животных. Обработка ведется в два этапа: на первом система выявляет любые животные сигналы, а на втором выделяет среди них именно характерный вой.
По заявленным данным, точность распознавания общих зоозвуков достигает 98,3%, а определение волчьего воя – 89%, что превышает результаты аналогичных систем, разработанных за последние шесть лет.
Новую технологию планируется использовать в полевых условиях при помощи автономных аудиорегистраторов. Это должно значительно упростить и ускорить мониторинг популяции хищников. Методика может быть адаптирована и под анализ звуков других представителей фауны, включая редких птиц.









