Stability AI lança Stability Audio 3.0 para gerar músicas de até 6 minutos
Stability AI apresentou a versão atualizada do Stability Audio 3.0 para síntese de música. A versão principal cria composições com até 6 minutos de duração…
Processado por IA de TechCrunch; editado por Hamidun News
Stability AI apresentou a versão atualizada do Stability Audio 3.0, que pode gerar composições musicais com até seis minutos de duração. Este é um passo significativo no desenvolvimento de sistemas de síntese de música baseados em inteligência artificial.
Duas versões para diferentes usos
A empresa lançou o modelo em duas versões, direcionadas para diferentes cenários de uso. A versão com todas as funcionalidades cria música com até 6 minutos de duração — já são canções completas, e não apenas fragmentos. A versão simplificada, chamada de small model, funciona diretamente no dispositivo do usuário sem conexão com serviços em nuvem.
O funcionamento local do modelo oferece várias vantagens práticas. Em primeiro lugar, menos latência na geração — o resultado é obtido quase instantaneamente. Em segundo lugar, mais privacidade — nenhum dado é enviado para servidores da empresa. Em terceiro lugar, o usuário não depende da estabilidade da conexão com a internet.
Capacidades e aplicações
O Stability Audio 3.0 continua desenvolvendo a abordagem text-to-audio, que Stability AI iniciou com versões anteriores do seu modelo. O sistema compreende descrições em linguagem natural e as transforma em música do estilo e duração desejados.
Os principais recursos incluem:
- Geração de composições originais baseada em descrição textual de gênero, humor e estilo
- Suporte para vários gêneros musicais, da música clássica à eletrônica
- Trabalho com descrições longas e detalhadas para gerar com precisão o som desejado
- Execução local em computadores pessoais sem infraestrutura em nuvem
- Escalabilidade de fragmentos curtos de 20 segundos a seis minutos completos
Esses recursos abrem caminho para aplicações práticas em diferentes áreas.
Onde isso pode ser útil
Para músicos e criadores de conteúdo, o Stability Audio 3.0 pode se tornar uma ferramenta para prototipagem rápida de ideias musicais. Em vez de procurar longamente por faixas prontas ou colaborar com compositores, é possível gerar em minutos várias opções de música de fundo, trilhas sonoras para vídeos ou versões de demonstração de suas composições.
Para streamers independentes e videobloggers, a geração local de música resolve o problema dos direitos autorais — eles podem criar composições originais sem comprar licenças de músicas prontas.
O que isso significa
O mercado de modelos de áudio generativos está se tornando cada vez mais competitivo e acessível. Se antes a síntese de música era controlada por algumas grandes empresas com infraestrutura em nuvem, agora surgem modelos abertos que funcionam localmente e não requerem poder computacional especial. Isso democratiza a criação de música e remove a dependência de serviços em nuvem e assinaturas.
Quer parar de ler sobre IA e começar a usar?
AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.