كيّفت Google DeepMind نموذج Perch 2.0: نموذج تغريد الطيور يتعرف على نداءات الحيتان
وجدت Google DeepMind استخدامًا غير متوقع لـ Perch 2.0: فالنموذج المدرّب على تغريد الطيور يتعرف بثقة أيضًا على إشارات الحيتان. وفي اختبارات على ثلاث مجموعات بيان

Google DeepMind нашла неожиданный способ изучать океан: модель Perch 2.0, созданная для распознавания пения птиц и других наземных животных, уверенно справляется и с голосами китов. Это может сократить время на разработку отдельных морских моделей и ускорить акустический мониторинг редких популяций.
Как проверяли модель
Perch 2.0 — это базовая биоакустическая модель, обученная на миллионах записей птиц, амфибий, насекомых и млекопитающих. Изначально её делали не для океана, а для анализа наземных звуковых ландшафтов.
Но в Google DeepMind и Google Research решили проверить, можно ли не строить новую систему с нуля для китов, а переиспользовать уже готовую основу. Логика простая: если базовая модель переносит знания между разными типами сигналов, то учёным не придётся тратить столько вычислений и времени на отдельную разработку. Для проверки команда взяла три морских аудиодатасета с голосами китов и другими подводными шумами.
Каждый фрагмент длительностью пять секунд переводили в спектрограмму — визуальную карту частот и интенсивности звука во времени. Затем Perch 2.0 превращала эти данные в эмбеддинги, то есть компактные наборы признаков, по которым можно отличить, например, свист косатки от сигнала горбатого кита.
После этого исследователи обучали простой логистический классификатор всего на нескольких примерах: от четырёх до 32 эмбеддингов на датасет. Даже при таком малом числе примеров качество оказалось высоким и росло с добавлением данных.
Почему перенос сработал Ключевая идея здесь — **transfer learning**, или перенос обучения.
Модель сначала учится выделять общие акустические закономерности на огромном массиве одних данных, а потом эти знания применяют к другой, но родственной задаче. В случае Perch 2.0 перенос выглядит особенно неожиданно: птицы поют в воздухе, а киты обмениваются сигналами под водой. Но модель, похоже, ловит не только среду передачи звука, а более тонкие паттерны — форму свиста, динамику частот, длительность и микроструктуру сигнала.
«Мы обучаем эту модель находить маленькие детали в звуковых ландшафтах».
Исследователи предлагают сразу несколько объяснений. У птиц и морских млекопитающих могут быть эволюционно похожие механизмы звукоизвлечения. Кроме того, большие модели, обученные на разнообразных данных, часто хорошо работают и вне исходного домена. Наконец, распознавание птичьих вокализаций само по себе очень сложное: модель вынуждена замечать мельчайшие различия. Это, вероятно, и помогает ей под водой. По словам команды, свисты некоторых популяций косаток даже лежат в похожем диапазоне спектрограмм, что и многие птичьи сигналы.
Зачем это биологам
Для исследователей океана такой результат важен не только как красивая демонстрация. В биоакустике постоянно открывают новые типы сигналов, а часть подводных шумов до сих пор вообще не имеет уверенной классификации. Если вместо создания отдельной модели под каждый вид можно взять мощную базовую систему и быстро дообучить лёгкий классификатор, то цикл исследований становится заметно короче. Это особенно полезно для пассивного акустического мониторинга, когда учёные месяцами слушают огромные массивы записей с буёв, гидрофонов и автономных станций.
- Быстрее запуск новых моделей для конкретных популяций китов Меньше затрат на обучение с нуля и перебор архитектур Работа даже при очень малом числе размеченных примеров * Более гибкий поиск редких и ещё неописанных типов сигналов Отдельно важно, что Perch 2.0 сравнили не только с предыдущей китовой моделью Google, но и с другими биоакустическими моделями для птиц, животных и коралловых рифов. В этом сравнении она оказалась либо лучшей, либо второй по качеству. То есть речь не о случайном удачном тесте, а о сильном результате на фоне специализированных альтернатив. Для природоохранных проектов это хороший сигнал: один фундаментальный аудиоинструмент может работать сразу в нескольких экосистемах.
Что это значит
История с Perch 2.0 показывает, что фундаментальные AI-модели начинают приносить пользу не только чат-ботам и генерации контента, но и полевой науке. Если перенос обучения работает между птицами и китами, у биологов появляется шанс быстрее отслеживать состояние популяций, замечать изменения в поведении животных и лучше защищать уязвимые виды.