Google تضيف مولد الموسيقى Lyria 3 إلى تطبيق Gemini
أعلنت Google دمج نموذج الصوت Lyria 3 من DeepMind في تطبيق Gemini على الهواتف. ويمكن للمستخدمين الآن إنشاء مقاطع موسيقية مدتها 30 ثانية باستخدام أوصاف نصية أو…
معالج بواسطة الذكاء الاصطناعي من The Verge؛ بتحرير Hamidun News
Google أضافت مولد الموسيقى Lyria 3 إلى تطبيق Gemini
اتخذت Google خطوة مهمة في تطوير مساعدها الذكي العام Gemini من خلال دمج نموذج الصوت المتقدم Lyria 3 من DeepMind في التطبيق المحمول. تسمح هذه الميزة الجديدة للمستخدمين بإنشاء تركيبات موسيقية قصيرة مدتها تصل إلى 30 ثانية بناءً على موجهات متنوعة: من الأوصاف النصية إلى الصور وحتى مقاطع الفيديو. يفتح هذا الابتكار، الذي تم إطلاقه في نمط بيتا على مستوى العالم، آفاقًا جديدة للتعبير الإبداعي ويعزز موقع Google في سوق خدمات الذكاء الاصطناعي التوليدي.
تكمن خلفية هذا التحديث في التطور السريع لتقنيات الذكاء الاصطناعي، خاصة في مجال توليد المحتوى المتعدد الوسائط. يمثل Lyria 3 الجيل الأحدث من نماذج الصوت من DeepMind، فرع Google المتخصص في البحث المتقدم في الذكاء الاصطناعي. الهدف من دمج Lyria 3 في Gemini هو تحويل مساعد الذكاء الاصطناعي من أداة للعمل مع النصوص إلى مركز إبداعي متعدد الوسائط كامل الأهلية. في السابق، كان Gemini قد أظهر بالفعل قدرات مثيرة للإعجاب في توليد الصور ومعالجة المعلومات النصية، والآن يكملها بمكون صوتي، مما يخلق حلاً شاملاً للمستخدمين الذين يسعون إلى إنشاء محتوى متنوع.
يكشف الغوص العميق في وظيفة Lyria 3 عن مدى مرونة عملية إنشاء الموسيقى. يمكن للمستخدمين تحديد أنواع موسيقية معينة، من موسيقى الروك الكلاسيكية إلى الموسيقى البيئية، والإشارة إلى الحالة المزاجية المرغوبة للتركيبة—من الفرحة والنشاط إلى الحزن والهدوء. توفر إمكانية استخدام الصور أو مقاطع الفيديو كنقطة انطلاق المزيد من الحدس والإبداع للعملية.
على سبيل المثال، يمكن تحميل صورة لغروب الشمس وطلب من الذكاء الاصطناعي إنشاء موسيقى تتوافق مع هذه الصورة البصرية. يعالج Gemini هذه الموجهات واستنادًا إلى إمكانيات Lyria 3، ينشئ مسارات فريدة مدتها 30 ثانية. تتوفر النسخة التجريبية من الميزة على مستوى العالم بعدة لغات، بما في ذلك الإنجليزية والألمانية والإسبانية والفرنسية والهندية واليابانية والكورية والبرتغالية، مع توقعات لتوسيع إضافي لدعم اللغات.
يقتصر الوصول إلى الميزة على مستخدمي تطبيق Gemini الذين تزيد أعمارهم عن 18 سنة، وفقًا لسياسة Google بشأن استخدام تقنيات الذكاء الاصطناعي.
تترتب على هذه الخطوة آثار كبيرة على Google والصناعة ككل. أولاً، فإنها تكثف المنافسة بين شركات التكنولوجيا الكبرى في مجال الذكاء الاصطناعي التوليدي. من خلال دمج إنشاء الموسيقى مباشرة في روبوت الدردشة الرئيسي الخاص بها، تقدم Google ميزة فريدة من خلال الجمع بين العمل مع النصوص والصور والصوت في واجهة واحدة يسهل الوصول إليها. قد يجذب هذا جمهورًا جديدًا من المستخدمين الذين يبحثون عن طرق بسيطة وسريعة لإنشاء محتوى موسيقي للمشاريع الشخصية أو وسائل التواصل الاجتماعي أو لمجرد الترفيه. ثانيًا، فإنها تمنح حق الوصول الشامل لعملية إنشاء الموسيقى، مما يجعلها في متناول حتى أولئك الذين لا يمتلكون مهارات موسيقية احترافية أو معدات مكلفة. يمكن للمستخدمين تجربة المشاهد الصوتية المختلفة دون مغادرة تطبيق Gemini، مما يحفز الاستكشاف الإبداعي والابتكار.
في الختام، يمثل دمج مولد الموسيقى Lyria 3 في تطبيق Gemini مرحلة مهمة في تطور مساعدي الذكاء الاصطناعي. من خلال تحويل Gemini إلى مركز إبداعي متعدد الوسائط، لا تعمل Google فقط على توسيع القدرات الوظيفية لمنتجها، بل تفتح أيضًا إمكانيات جديدة لملايين المستخدمين في جميع أنحاء العالم. يؤكد هذا الابتكار التزام Google بإنشاء أدوات أكثر بديهية وقوة للإبداع، مما يمحو الحدود بين أشكال الوسائط المختلفة ويجعل الذكاء الاصطناعي متكاملاً بشكل أعمق في الحياة اليومية.
هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟
AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.