SkyMusic : pourquoi la chinoise Kunlun Tech a inquiété Suno et Udio
Soyons honnêtes : jusqu'à récemment, la plupart des pistes générées par l'IA sonnaient comme un robot essayant d'imiter le chant sous l'eau. Nous nous sommes…
Traité par IA depuis Jiqizhixin (机器之心) ; édité par Hamidun News
Soyons honnêtes : jusqu'à récemment, la plupart des pistes générées par l'IA sonnaient comme un robot essayant d'imiter le chant sous l'eau. Nous nous sommes habitués à Suno et Udio comme l'étalon-or, mais l'industrie de l'IA évolue trop rapidement pour que quiconque puisse se reposer sur ses lauriers très longtemps. La chinoise Kunlun Tech est entrée en scène avec son nouveau développement, SkyMusic, et c'est l'un de ces cas où les titres sensationnalistes sur les "tueurs de leaders" ont une substance réelle derrière eux.
Pour comprendre l'ampleur de ce moment, il convient de rappeler que Kunlun n'est pas qu'une autre startup, mais un géant derrière le navigateur Opera et un puissant écosystème Skywork. Le principal défi de la musique avec l'IA a toujours été la nuance. Générer un rythme ou une simple mélodie est un problème de 2023.
En 2024, nous voulons entendre l'émotion, la respiration, les changements subtils de timbre et ce que les musiciens appellent "l'âme". SkyMusic mise précisément sur cela. Les développeurs ont appliqué l'architecture des grands modèles de langage (LLM) directement aux tokens audio.
Au lieu de simplement mélanger les couches sonores, le système comprend la structure d'une chanson de la même manière que GPT comprend la structure du texte. Cela permet au modèle de générer des voix qui sonnent étrangement naturelles. Si vous fermiez les yeux, dans de nombreux cas, vous ne pourriez pas distinguer l'enregistrement d'une interprétation en direct dans un studio de niveau moyen.
Les spécifications techniques sont impressionnantes, mais ce n'est pas l'essentiel ici. Oui, 80 secondes de génération et 44,1 kHz est la norme industrielle. Ce qui compte beaucoup plus, c'est comment SkyMusic gère le multitâche.
Elle gère simultanément le texte, la mélodie et l'arrangement, en maintenant l'intégrité stylistique tout au long de la piste. Les ingénieurs chinois affirment que leur modèle est le premier du genre à atteindre ce niveau de qualité dans la génération complète. C'est un sérieux défi pour les entreprises occidentales, qui sont maintenant plus concentrées sur les aspects juridiques de l'utilisation du contenu protégé par le droit d'auteur que sur les avancées technologiques pures.
Que signifie cela pour l'industrie dans son ensemble ? Nous assistons à la formation de deux piles technologiques parallèles. D'un côté—les modèles américains, entravés par les réglementations et les poursuites potentielles des labels.
De l'autre—les solutions chinoises se développant à une vitesse incroyable, soutenues par d'énormes ressources informatiques internes. Kunlun Tech a clairement l'intention de faire de SkyMusic un produit mondial, et elle dispose de toutes les ressources pour cela. Le fait que le modèle occupe déjà des positions de haut rang dans les benchmarks spécialisés suggère que l'écart entre l'Orient et l'Occident dans l'IA créative se réduit rapidement et, dans certains domaines, a déjà disparu.
Bien sûr, des questions demeurent sur l'éthique et la manière dont la communauté professionnelle acceptera ces outils. Mais la réalité est celle-ci : la barrière à l'entrée pour créer un contenu musical de qualité a baissé encore plus. Maintenant, pour créer un succès, vous n'avez pas besoin de chanter ou de jouer d'un instrument—il suffit d'avoir une idée et le bon prompt.
SkyMusic n'est pas juste "un autre réseau de neurones" ; c'est la confirmation que la musique se transforme enfin en données qui peuvent être manipulées aussi facilement que le texte dans un chatbot. Nous entrons dans une ère où la concurrence ne sera basée non pas sur la pureté du son, mais sur l'originalité de l'idée, car la perfection technique est maintenant disponible en un clic de bouton. L'essentiel : Kunlun Tech a prouvé que le leadership dans la musique avec l'IA n'est pas verrouillé à la Silicon Valley.
Êtes-vous prêt pour que votre prochaine chanson préférée soit écrite par un réseau de neurones chinois ?
Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?
AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.