Український студент навчив ШІ імітувати спів птахів — технологію вже тестують екологи
Випускник Українського католицького університету Андрій Шевцов створив ШІ-модель, що генерує звуки сотень видів птахів — від вивільги до страуса.
Про це пише dev.ua.
Розробку вже обговорюють екологи: вона може стати інструментом для біоакустичного моніторингу довкілля та допомогти у збереженні довкілля після повномасштабної війни.
За словами автора, тема була майже не дослідженою: більшість ШІ-проєктів зосереджені на музиці чи людському голосі, а складно структуровані звуки тварин досі лишалися поза увагою.
У своїй дипломній роботі “Генерація вокалізації птахів за допомогою глибокого навчання” Андрій поєднав кілька підходів: інференс (процес генерації результату) готових моделей “текст-в-аудіо”, донавчання наявних моделей, тренування з нуля та зміна архітектури під специфіку пташиного голосу.
На демонстраційній сторінці доступні приклади згенерованих голосів 12 видів птахів — від популярних до рідкісних. Система вже працює у вигляді Python-модуля і незабаром буде доступна у відкритому форматі. Також триває підготовка наукової публікації.
ШI-імітації можуть бути корисні й для:
- відлякування птахів із летовищ і полів,
- зниження стресу птахів у реабілітаційних центрах,
- вивчення комунікації й соціальної поведінки птахів
- створення освітніх застосунків, звукових інсталяцій і навіть аудіо для кіно.
“Птахи — це лише верхівка екосистеми, але й зручний індикатор її стану, адже вони активно й гучно комунікують. В умовах втрат природного середовища через бойові дії, забруднення й замінування збереження решток флори й фауни стане національним завданням. Пасивний акустичний моніторинг дасть змогу виявляти ділянки з рідкісними видами для охорони, фіксувати порушення і реагувати на детонації в ізольованих районах, знижуючи ризики для людей”, — зазначає Андрій Шевцов.
У майбутньому технологію планують використати для симуляції звукових ландшафтів, щоб краще готуватися до змін клімату або міграції видів.
Монетизувати проєкт автор поки не планує. Натомість веде комунікацію з екологами та фахівцями з машинного навчання, щоб адаптувати інструмент для використання у реальних умовах.
Послухати згенеровані звуки можна на демосторінці.



