The Verge→ original

Google ajoute le générateur de musique Lyria 3 à l'application Gemini

Google a présenté l'intégration du modèle audio Lyria 3 de DeepMind dans l'application mobile Gemini. Les utilisateurs peuvent désormais générer des morceaux…

Traité par IA depuis The Verge ; édité par Hamidun News
Google ajoute le générateur de musique Lyria 3 à l'application Gemini
Source : The Verge. Collage: Hamidun News.
◐ Écouter l'article

Google a ajouté le générateur de musique Lyria 3 à l'application Gemini

Google a franchi une étape importante dans le développement de son assistant IA universel Gemini en intégrant le modèle audio avancé Lyria 3 de DeepMind dans l'application mobile. Cette nouvelle fonctionnalité permet aux utilisateurs de créer des compositions musicales courtes d'une durée maximale de 30 secondes basées sur des invites variées : des descriptions textuelles aux images et même aux vidéos. L'innovation, lancée en mode bêta à l'échelle mondiale, ouvre de nouveaux horizons pour l'expression créative et renforce la position de Google sur le marché des services d'IA générative.

Les antécédents de cette mise à jour résident dans le développement rapide des technologies d'intelligence artificielle, en particulier dans le domaine de la génération de contenu multimédia. Lyria 3 représente la dernière génération de modèles audio de DeepMind, la filiale de Google spécialisée dans la recherche avancée en IA. L'objectif d'intégrer Lyria 3 à Gemini est de transformer l'assistant IA d'un outil de travail sur le texte en un véritable centre créatif multimédia. Auparavant, Gemini avait déjà démontré des capacités impressionnantes en matière de génération d'images et de traitement d'informations textuelles, et les complète désormais par un composant audio, créant une solution complète pour les utilisateurs cherchant à créer du contenu diversifié.

Une plongée profonde dans la fonctionnalité de Lyria 3 montre à quel point le processus de création musicale est devenu flexible. Les utilisateurs peuvent spécifier des genres particuliers, du rock classique à l'ambient, indiquer l'ambiance souhaitée de la composition—de joyeuse et énergique à mélancolique et calme. La capacité à utiliser des images ou des vidéos comme point de départ rend le processus encore plus intuitif et créatif.

Par exemple, on peut télécharger une photographie d'un coucher de soleil et demander à l'IA de générer une musique correspondant à cette image visuelle. Gemini traite ces invites et, en s'appuyant sur les capacités de Lyria 3, crée des pistes uniques de 30 secondes. La version bêta de la fonctionnalité est disponible mondialement dans plusieurs langues, notamment l'anglais, l'allemand, l'espagnol, le français, l'hindi, le japonais, le coréen et le portugais, avec des perspectives d'expansion supplémentaire du support linguistique.

L'accès à la fonctionnalité est limité aux utilisateurs de l'application Gemini âgés de plus de 18 ans, conformément à la politique de Google concernant l'utilisation des technologies d'IA.

Les implications de cette démarche pour Google et l'industrie dans son ensemble sont assez importantes. Premièrement, elle intensifie la concurrence entre les grandes entreprises technologiques dans le domaine de l'IA générative. En intégrant la création musicale directement dans son principal chatbot, Google offre un avantage unique en combinant le travail avec le texte, les images et le son dans une interface unique et accessible.

Cela pourrait attirer un nouveau public d'utilisateurs à la recherche de moyens simples et rapides de créer du contenu musical pour des projets personnels, des réseaux sociaux ou simplement pour le divertissement. Deuxièmement, elle démocratise le processus de création musicale, le rendant accessible même à ceux qui n'ont pas de compétences musicales professionnelles ou d'équipement coûteux. Les utilisateurs peuvent expérimenter différents paysages sonores sans quitter l'application Gemini, ce qui stimule l'exploration créative et l'innovation.

En conclusion, l'intégration du générateur de musique Lyria 3 dans l'application Gemini représente une étape importante dans l'évolution des assistants IA. En transformant Gemini en centre créatif multimédia, Google non seulement étend les capacités fonctionnelles de son produit, mais ouvre également de nouvelles possibilités à des millions d'utilisateurs dans le monde entier. Cette innovation souligne l'engagement de Google à créer des outils plus intuitifs et puissants pour la créativité, effaçant les frontières entre les différentes formes de médias et intégrant l'intelligence artificielle encore davantage dans la vie quotidienne.

ZK
Hamidun News
Actualités IA sans bruit. Sélection éditoriale quotidienne de plus de 400 sources. Produit de Zhemal Khamidun, Head of AI chez Alpina Digital.

Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?

AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.

Qu'en pensez-vous ?
Chargement des commentaires…