Jiqizhixin (机器之心)→ original

SkyMusic: Por qué Kunlun Tech china hizo que Suno y Udio se pusieran nerviosos

Seamos honestos: hasta hace poco, la mayoría de pistas generadas por IA sonaban como un robot intentando imitar el canto bajo el agua. Nos hemos acostumbrado…

Procesado por IA desde Jiqizhixin (机器之心); editado por Hamidun News
SkyMusic: Por qué Kunlun Tech china hizo que Suno y Udio se pusieran nerviosos
Fuente: Jiqizhixin (机器之心). Collage: Hamidun News.
◐ Escuchar artículo

Seamos honestos: hasta hace poco, la mayoría de pistas generadas por IA sonaban como un robot intentando imitar el canto bajo el agua. Nos hemos acostumbrado a Suno y Udio como el estándar de oro, pero la industria de IA evoluciona demasiado rápido como para que alguien pueda descansar en los laureles durante mucho tiempo. La china Kunlun Tech ha entrado en escena con su nuevo desarrollo, SkyMusic, y este es uno de esos casos en los que los titulares bombásticos sobre "asesinos de líderes" tienen sustancia real detrás.

Para entender la magnitud de este momento, vale la pena recordar que Kunlun no es solo otro startup, sino un gigante detrás del navegador Opera y de un poderoso ecosistema Skywork. El principal desafío en la música con IA siempre ha sido el matiz. Generar un ritmo o una melodía simple es un problema de 2023.

En 2024, queremos escuchar emoción, respiración, cambios sutiles en el timbre y lo que los músicos llaman "alma". SkyMusic está apostando precisamente por eso. Los desarrolladores aplicaron la arquitectura de modelos de lenguaje grande (LLM) directamente a tokens de audio.

En lugar de simplemente mezclar capas de sonido, el sistema entiende la estructura de una canción de la misma manera que GPT entiende la estructura del texto. Esto permite que el modelo genere voces que suenan perturbadoramente naturales. Si cierras los ojos, en muchos casos no podrás distinguir la grabación de una actuación en vivo en un estudio de nivel medio.

Las especificaciones técnicas son impresionantes, pero no son lo principal aquí. Sí, 80 segundos de generación y 44.1 kHz es el estándar industrial.

Lo que importa mucho más es cómo SkyMusic maneja la multitarea. Administra simultáneamente el texto, la melodía y el arreglo, manteniendo la integridad estilística en toda la pista. Los ingenieros chinos afirman que su modelo es el primero en su tipo en lograr este nivel de calidad en la generación integral.

Este es un serio desafío para las empresas occidentales, que ahora están más enfocadas en aspectos legales del uso de contenido protegido por derechos de autor que en avances tecnológicos puros. ¿Qué significa esto para la industria en general? Estamos presenciando la formación de dos pilas tecnológicas paralelas.

Por un lado—modelos estadounidenses, restringidos por regulaciones y posibles demandas de los sellos discográficos. Por otro—soluciones chinas desarrollándose a velocidad increíble, respaldadas por enormes recursos computacionales internos. Kunlun Tech claramente tiene la intención de hacer que SkyMusic sea un producto global, y tiene todos los recursos para ello.

El hecho de que el modelo ya ocupe posiciones principales en benchmarks especializados sugiere que la brecha entre Oriente y Occidente en IA creativa se está reduciendo rápidamente y, en algunas áreas, ya ha desaparecido.

Por supuesto, quedan preguntas sobre ética y cómo la comunidad profesional aceptará estas herramientas. Pero la realidad es esta: la barrera de entrada para crear contenido musical de calidad ha bajado aún más. Ahora, para crear un éxito, no necesitas cantar ni tocar un instrumento—solo necesitas una idea y el prompt correcto.

SkyMusic no es solo "otra red neuronal"; es la confirmación de que la música finalmente se está convirtiendo en datos que se pueden manipular tan fácilmente como el texto en un chatbot. Estamos entrando en una era donde la competencia se basará no en la pureza del sonido, sino en la originalidad de la idea, porque la perfección técnica ahora está disponible con un clic de botón. La conclusión: Kunlun Tech ha demostrado que el liderazgo en música con IA no está restringido al Valle del Silicio.

¿Estás listo para que tu próxima canción favorita sea escrita por una red neuronal china?

ZK
Hamidun News
Noticias de AI sin ruido. Selección editorial diaria de más de 400 fuentes. Producto de Zhemal Khamidun, Head of AI en Alpina Digital.

¿Quieres dejar de leer sobre IA y empezar a usarla?

AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.

¿Qué te parece?
Cargando comentarios…