Stability AI выпустила Stability Audio 3.0 для генерации многоминутных песен
Stability AI представила обновлённую аудио-модель Stability Audio 3.0 для синтеза музыки. Основная версия создаёт композиции длиной до 6 минут. Облегчённая верс

Stability AI представила обновлённую версию своей аудио-модели Stability Audio 3.0, которая может генерировать музыкальные композиции длиной до шести минут. Это значительный шаг вперёд в развитии систем синтеза музыки на основе искусственного интеллекта.
Две версии для разных задач
Компания выпустила модель в двух вариантах, нацеленных на разные сценарии использования. Полнофункциональная версия создаёт музыку длиной до 6 минут — это уже полноценные песни, а не просто фрагменты. Облегчённая версия, называемая small model, работает прямо на устройстве пользователя без подключения к облачным сервисам. Локальная работа модели означает несколько практических преимуществ. Во-первых, меньше задержек при генерации — результат получается практически мгновенно. Во-вторых, больше приватности — никакие данные не отправляются на серверы компании. В-третьих, пользователь не зависит от стабильности интернет-соединения.
Возможности и применение
Stability Audio 3.0 продолжает развивать подход текст-в-аудио, который Stability AI начала с предыдущих версий своей модели. Система понимает описание на естественном языке и преобразует его в музыку нужного стиля и продолжительности. Основные возможности включают: Генерация оригинальных композиций по текстовому описанию жанра, настроения и стиля Поддержка разных жанров музыки от классики до электроники Работа с длинными и детальными описаниями для точной генерации нужного звука Локальное исполнение на персональных компьютерах без облачной инфраструктуры * Масштабирование от коротких 20-секундных фрагментов до полноценных шести минут Эти возможности открывают путь к практическому применению в разных сферах.
Где это может быть полезным
Для музыкантов и создателей контента Stability Audio 3.0 может стать инструментом для быстрого прототипирования музыкальных идей. Вместо долгого поиска готовых треков или сотрудничества с композиторами можно за минуты сгенерировать несколько вариантов фоновой музыки, саундтреков для видео или демо-версии своих произведений. Для независимых стримеров и видеоблогеров локальная генерация музыки решает проблему авторских прав — они могут создавать оригинальные композиции, не покупая лицензии на готовую музыку.
Что это значит Рынок генеративных аудио-моделей становится всё конкурентнее и доступнее.
Если раньше синтез музыки контролировали несколько больших компаний с облачной инфраструктурой, теперь появляются открытые модели, которые работают локально и не требуют особых вычислительных мощностей. Это демократизирует создание музыки и убирает зависимость от облачных сервисов и подписок.