Stability AI a lancé Stability Audio 3.0 pour générer des chansons de plusieurs minutes
Stability AI a présenté le modèle audio mis à jour Stability Audio 3.0 pour la synthèse musicale. La version principale crée des compositions d'une durée maxima
Traité par IA depuis TechCrunch ; édité par Hamidun News
Stability AI a présenté une version mise à jour de son modèle audio Stability Audio 3.0, qui peut générer des compositions musicales d'une durée maximale de six minutes. C'est une étape importante dans le développement des systèmes de synthèse musicale basés sur l'intelligence artificielle.
Deux versions pour différentes tâches
L'entreprise a lancé le modèle en deux versions, adaptées à différents scénarios d'utilisation. La version complète crée de la musique d'une durée maximale de 6 minutes — ce sont déjà des chansons complètes, et non de simples fragments. La version allégée, appelée small model, fonctionne directement sur l'appareil de l'utilisateur sans connexion aux services cloud.
Le fonctionnement local du modèle présente plusieurs avantages pratiques. Premièrement, moins de latence lors de la génération — le résultat est obtenu quasi instantanément. Deuxièmement, plus de confidentialité — aucune donnée n'est envoyée aux serveurs de l'entreprise. Troisièmement, l'utilisateur ne dépend pas de la stabilité de la connexion Internet.
Capacités et applications
Stability Audio 3.0 continue de développer l'approche texte-en-audio, que Stability AI a commencée avec les versions précédentes de son modèle. Le système comprend une description en langage naturel et la convertit en musique du style et de la durée souhaités.
Les capacités principales incluent :
- Génération de compositions originales à partir d'une description textuelle du genre, de l'humeur et du style
- Support de différents genres musicaux, de la musique classique à l'électronique
- Travail avec des descriptions longues et détaillées pour une génération précise du son souhaité
- Exécution locale sur les ordinateurs personnels sans infrastructure cloud
- Mise à l'échelle allant de courts fragments de 20 secondes à six minutes complètes
Ces capacités ouvrent la voie à des applications pratiques dans divers domaines.
Où cela peut être utile
Pour les musiciens et les créateurs de contenu, Stability Audio 3.0 peut devenir un outil de prototypage rapide d'idées musicales. Au lieu de chercher longtemps des pistes prêtes à l'emploi ou de collaborer avec des compositeurs, on peut générer en quelques minutes plusieurs variantes de musique de fond, de bandes sonores pour des vidéos ou de démos de ses propres compositions.
Pour les streamers indépendants et les vidéoblogueurs, la génération locale de musique résout le problème des droits d'auteur — ils peuvent créer des compositions originales sans acheter de licences pour de la musique prête à l'emploi.
Ce que cela signifie
Le marché des modèles audio génératifs devient de plus en plus compétitif et accessible. Si auparavant la synthèse musicale était contrôlée par quelques grandes entreprises disposant d'une infrastructure cloud, on voit maintenant apparaître des modèles ouverts qui fonctionnent localement et ne nécessitent pas de puissance de calcul particulière. Cela démocratise la création musicale et supprime la dépendance aux services cloud et aux abonnements.
Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?
AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.