SkyMusic: لماذا أجبرت الصينية Kunlun Tech شركات Suno و Udio على القلق
دعونا نكون صريحين: حتى وقت قريب، كانت معظم المقطوعات الموسيقية المولدة بالذكاء الاصطناعي تبدو كما لو أن روبوتاً يحاول محاكاة الغناء تحت الماء. اعتدنا على…
معالج بواسطة الذكاء الاصطناعي من Jiqizhixin (机器之心)؛ بتحرير Hamidun News
دعونا نكون صريحين: حتى وقت قريب، كانت معظم المقطوعات الموسيقية المولدة بالذكاء الاصطناعي تبدو كما لو أن روبوتاً يحاول محاكاة الغناء تحت الماء. اعتدنا على Suno و Udio باعتبارهما المعيار الذهبي، لكن صناعة الذكاء الاصطناعي تتطور بسرعة كبيرة جداً بحيث لا يمكن لأحد أن يستريح على أمجاده لفترة طويلة. دخلت شركة كونلون تيك الصينية الساحة بتطويرها الجديد، سكاي ميوزيك، وهذه واحدة من تلك الحالات التي تحتوي فيها العناوين الرنانة حول "قاتل القادة" على جوهر حقيقي وراءها.
لفهم حجم هذه اللحظة، يجدر التذكير بأن كونلون ليست مجرد شركة ناشئة أخرى، بل عملاق يقف خلف متصفح أوبيرا وأنظمة سكايورك القوية. كان التحدي الرئيسي في الموسيقى مع الذكاء الاصطناعي دائماً هو التفاصيل الدقيقة. توليد نبضة أو لحن بسيط مشكلة من 2023.
في عام 2024، نريد أن نسمع العاطفة والتنفس والتغييرات الدقيقة في الجرس وما يسميه الموسيقيون "الروح". تراهن سكاي ميوزيك على هذا بالضبط. طبق المطورون معمارية نماذج اللغة الكبيرة (LLM) مباشرة على الرموز الصوتية.
بدلاً من مجرد خلط طبقات الصوت، يفهم النظام بنية الأغنية بنفس الطريقة التي يفهم بها GPT بنية النص. هذا يسمح للنموذج بتوليد الصوت الغنائي الذي يبدو طبيعياً بطريقة غير مريحة. إذا أغلقت عينيك، في كثير من الحالات لن تتمكن من تمييز التسجيل عن أداء مباشر في استوديو على مستوى متوسط.
المواصفات التقنية مثيرة للإعجاب، لكنها ليست النقطة الرئيسية هنا. نعم، 80 ثانية من التوليد و44.1 كيلوهرتز هو المعيار الصناعي.
ما يهم بكثير أكثر هو كيفية تعامل سكاي ميوزيك مع تعدد المهام. تدير النصوص والألحان والترتيب في نفس الوقت، مع الحفاظ على التماسك الأسلوبي طوال المقطع. يؤكد المهندسون الصينيون أن نموذجهم هو الأول من نوعه الذي يحقق هذا المستوى من الجودة في التوليد الشامل.
هذا تحدٍ جاد للشركات الغربية، التي تركز الآن أكثر على الجوانب القانونية لاستخدام المحتوى المحمي بحقوق النشر أكثر من التقدم التكنولوجي النقي. ماذا يعني هذا للصناعة ككل؟ نشهد تشكيل مكدسي تكنولوجيين متوازيين. من جهة—النماذج الأمريكية، المقيدة بالتنظيمات والدعاوى المحتملة من شركات التسجيلات.
من جهة أخرى—الحلول الصينية التي تتطور بسرعة لا تصدق، مدعومة بموارد حوسبة ضخمة داخلية. تنوي شركة كونلون تيك بوضوح جعل سكاي ميوزيك منتجاً عالمياً، ولديها جميع الموارد اللازمة لذلك. تشير حقيقة أن النموذج يحتل بالفعل مراكز متقدمة في المعايير المتخصصة إلى أن الفجوة بين الشرق والغرب في الذكاء الاصطناعي الإبداعي تتقلص بسرعة وفي بعض المناطق اختفت بالفعل.
بالطبع، تبقى أسئلة حول الأخلاق وكيفية قبول المجتمع المهني لمثل هذه الأدوات. لكن الواقع هو هذا: انخفضت حاجز الدخول لإنشاء محتوى موسيقي عالي الجودة حتى أكثر. الآن، لإنشاء أغنية ناجحة، لا تحتاج إلى الغناء أو العزف على آلة موسيقية—تحتاج فقط إلى فكرة والمحفز الصحيح.
سكاي ميوزيك ليست مجرد "شبكة عصبية أخرى"; إنها تأكيد على أن الموسيقى تتحول أخيراً إلى بيانات يمكن التلاعب بها بسهولة مثل النص في روبوت محادثة. نحن ندخل عصراً حيث ستكون المنافسة قائمة ليس على نقاء الصوت، بل على أصالة الفكرة، لأن الكمال التقني متاح الآن بنقرة زر. الخلاصة: أثبتت شركة كونلون تيك أن القيادة في موسيقى الذكاء الاصطناعي ليست محصورة في وادي السيليكون.
هل أنت مستعد لأن تكون أغنيتك المفضلة القادمة مكتوبة من قبل شبكة عصبية صينية?
هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟
AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.