Jiqizhixin (机器之心)→ оригинал

SkyMusic: por que a Kunlun Tech chinesa deixou Suno e Udio nervosos

Китайская компания Kunlun Tech представила SkyMusic — первую в стране большую модель для генерации музыки, способную на равных конкурировать с западными лидерам

SkyMusic: por que a Kunlun Tech chinesa deixou Suno e Udio nervosos
Источник: Jiqizhixin (机器之心). Коллаж: Hamidun News.

Давайте честно: до недавнего времени большинство нейросетевых треков звучали так, будто робот пытается имитировать пение под водой. Мы привыкли к Suno и Udio как к золотому стандарту, но индустрия AI развивается слишком быстро, чтобы кто-то мог долго почивать на лаврах. На сцену вышла китайская Kunlun Tech со своей новой разработкой SkyMusic, и это тот случай, когда громкие заголовки про «убийцу лидеров» имеют под собой реальную почву.

Чтобы понять масштаб события, нужно вспомнить, что Kunlun — это не просто очередной стартап, а гигант, стоящий за браузером Opera и мощной экосистемой Skywork. Главная проблема AI-музыки всегда заключалась в нюансах. Сгенерировать бит или простенькую мелодию — задача для 2023 года.

В 2024 году мы хотим слышать эмоции, придыхания, едва заметные изменения тембра и то, что музыканты называют «душой». SkyMusic делает ставку именно на это. Разработчики применили архитектуру больших языковых моделей (LLM) непосредственно к аудио-токенам.

Вместо того чтобы просто смешивать звуковые слои, система понимает структуру песни так же, как GPT понимает структуру текста. Это позволяет модели генерировать вокал, который звучит пугающе естественно. Если закрыть глаза, во многих случаях вы не отличите запись от живого исполнения в студии среднего уровня.

Технические характеристики впечатляют, но не они здесь главные. Да, 80 секунд генерации и 44.1 кГц — это индустриальный стандарт.

Куда важнее то, как SkyMusic работает с многозадачностью. Она одновременно управляет текстом, мелодией и аранжировкой, сохраняя стилистическую целостность на протяжении всего трека. Китайские инженеры утверждают, что их модель — первая в своем роде, достигшая такого уровня качества в комплексной генерации.

Это серьезный вызов для западных компаний, которые сейчас больше сосредоточены на юридических аспектах использования авторского контента, чем на чистом технологическом рывке. Что это значит для индустрии в целом? Мы наблюдаем формирование двух параллельных технологических стеков.

С одной стороны — американские модели, зажатые в тиски регуляций и потенциальных исков от лейблов. С другой — китайские решения, которые развиваются с невероятной скоростью, опираясь на огромные внутренние вычислительные мощности. Kunlun Tech явно намерена сделать SkyMusic глобальным продуктом, и у них есть для этого все ресурсы.

Тот факт, что модель уже занимает топовые позиции в профильных тестах, говорит о том, что разрыв между Востоком и Западом в области креативного AI стремительно сокращается, а в чем-то — уже исчез. Конечно, остаются вопросы к этике и тому, как профессиональное сообщество примет такие инструменты. Но реальность такова: порог входа в создание качественного музыкального контента упал еще ниже.

Теперь для того, чтобы создать хит, не нужно уметь петь или играть на инструментах — достаточно иметь идею и правильный промпт. SkyMusic не просто «еще одна нейронка», это подтверждение того, что музыка окончательно превращается в данные, которыми можно манипулировать так же легко, как текстом в чат-боте. Мы входим в эру, где конкуренция будет идти не за чистоту звука, а за оригинальность идеи, потому что техническое совершенство теперь доступно по нажатию одной кнопки.

Главное: Kunlun Tech доказала, что лидерство в AI-музыке не закреплено за Кремниевой долиной. Готовы ли вы к тому, что ваш следующий любимый трек будет написан китайской нейросетью?

ЖХ
Hamidun News
AI‑новости без шума. Ежедневный редакторский отбор из 400+ источников. Продукт Жемала Хамидуна, Head of AI в Alpina Digital.
Загружаем комментарии…