SkyMusic: por que a Kunlun Tech chinesa deixou Suno e Udio nervosos
Vamos ser honestos: até recentemente, a maioria das faixas geradas por IA soavam como um robô tentando imitar o canto debaixo d'água. Nos acostumamos com…
Processado por IA de Jiqizhixin (机器之心); editado por Hamidun News
Vamos ser honestos: até recentemente, a maioria das faixas geradas por IA soavam como um robô tentando imitar o canto debaixo d'água. Nos acostumamos com Suno e Udio como o padrão ouro, mas a indústria de IA evolui tão rapidamente que ninguém pode descansar nos louros por muito tempo. A chinesa Kunlun Tech entrou em cena com seu novo desenvolvimento, SkyMusic, e este é um daqueles casos em que manchetes bombásticas sobre "matadores de líderes" têm substância real por trás delas.
Para entender a escala deste momento, vale lembrar que Kunlun não é apenas outro startup, mas um gigante por trás do navegador Opera e de um poderoso ecossistema Skywork. O principal desafio da música com IA sempre foi a nuance. Gerar uma batida ou uma melodia simples é um problema de 2023.
Em 2024, queremos ouvir emoção, respiração, mudanças sutis no timbre e o que os músicos chamam de "alma". SkyMusic está apostando justamente nisso. Os desenvolvedores aplicaram arquitetura de modelos de linguagem grandes (LLM) diretamente aos tokens de áudio.
Em vez de simplesmente misturar camadas sonoras, o sistema entende a estrutura da música da mesma forma que GPT entende a estrutura do texto. Isso permite que o modelo gere vocais que soam perturbadoramente naturais. Se você fechar os olhos, em muitos casos não conseguirá distinguir a gravação de uma apresentação ao vivo em um estúdio de nível médio.
As características técnicas são impressionantes, mas não são o ponto principal aqui. Sim, 80 segundos de geração e 44.1 kHz é o padrão industrial.
O que importa muito mais é como SkyMusic lida com multitarefa. Ela gerencia simultaneamente texto, melodia e arranjo, mantendo a integridade estilística em toda a faixa. Engenheiros chineses afirmam que seu modelo é o primeiro do seu tipo a alcançar esse nível de qualidade em geração abrangente.
Este é um desafio sério para as empresas ocidentais, que agora estão mais focadas em aspectos legais do uso de conteúdo protegido por direitos autorais do que em saltos tecnológicos puros. O que isso significa para a indústria como um todo? Estamos presenciando a formação de duas pilhas tecnológicas paralelas.
De um lado—modelos americanos, constrangidos por regulamentações e possíveis processos judiciais de gravadoras. Do outro—soluções chinesas desenvolvendo-se em velocidade incrível, apoiadas por enormes recursos computacionais internos. Kunlun Tech claramente pretende tornar SkyMusic um produto global, e tem todos os recursos para isso.
O fato de o modelo já ocupar posições de destaque em benchmarks especializados sugere que a lacuna entre Oriente e Ocidente em IA criativa está diminuindo rapidamente e, em algumas áreas, já desapareceu.
Claro, questões sobre ética e como a comunidade profissional aceitará essas ferramentas permanecem. Mas a realidade é esta: a barreira de entrada para criar conteúdo musical de qualidade caiu ainda mais. Agora, para criar um sucesso, você não precisa cantar ou tocar um instrumento—basta ter uma ideia e o prompt certo.
SkyMusic não é apenas "mais uma rede neural"; é confirmação de que a música finalmente está se transformando em dados que podem ser manipulados tão facilmente quanto texto em um chatbot. Estamos entrando em uma era onde a competição será baseada não na pureza do som, mas na originalidade da ideia, porque a perfeição técnica agora está disponível com um clique de botão. A conclusão: Kunlun Tech provou que a liderança em música com IA não está restrita ao Vale do Silício.
Você está pronto para que sua próxima música favorita seja escrita por uma rede neural chinesa?
Quer parar de ler sobre IA e começar a usar?
AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.