TechCrunch→ المصدر

أطلقت Mistral نموذجًا مفتوحًا لتوليد الكلام للهواتف الذكية والساعات الذكية

أطلقت Mistral نموذجًا مفتوحًا لتوليد الكلام يعمل مباشرة على الهاتف الذكي أو الساعة الذكية — من دون الرجوع إلى خوادم سحابية. وعلى خلاف ElevenLabs وOpenAI TTS،…

معالج بواسطة الذكاء الاصطناعي من TechCrunch؛ بتحرير Hamidun News
أطلقت Mistral نموذجًا مفتوحًا لتوليد الكلام للهواتف الذكية والساعات الذكية
المصدر: TechCrunch. كولاج: Hamidun News.
◐ استمع للمقال

أطلقت شركة الذكاء الاصطناعي الفرنسية Mistral نموذجاً جديداً مفتوح المصدر لتوليد الكلام. يكمن الفرق الرئيسي عن المنافسين في أنه يعمل مباشرة على هاتف ذكي أو ساعة ذكية دون الاتصال بخوادم خارجية. لطالما تطلبت شبكات الكلام العصبية موارد حسابية كبيرة. حتى أنظمة تحويل النص إلى كلام الخفيفة نسبياً كانت غالباً تستهلك مئات الميجابايت وتبطئ بشكل ملحوظ معالجات الهاتف المحمول.

الحل الصناعي هو الاستدلال السحابي: يتم إرسال طلب إلى خادم ويُرجع ملف صوتي في أجزاء من الثانية. المخطط يعمل لكن لديه قيود أساسية. الاعتماد على الإنترنت يجعل هذه الأنظمة عديمة الفائدة في المناطق الخالية من التغطية. تكاليف كل استدعاء API تتراكم مع التوسع. ونقل بيانات المستخدم إلى خوادم الجهات الخارجية يخلق مشاكل خصوصية، خاصة في قطاع الصحة والقطاع المؤسسي. بالنسبة للتكامل في الأجهزة القابلة للارتداء، هذا النهج غير مناسب.

تقدم Mistral مساراً مختلفاً. بنت الشركة سمعتها على نماذج اللغة: Mistral 7B و Mixtral 8x7B أصبحا معياراً في مجتمع المصدر المفتوح بفضل الجودة العالية مع الحجم المضغوط. الآن يتم تطبيق نفس الفلسفة على توليد الكلام.

تمثل ساعات SmartWatches بيئة حسابية محدودة بشكل أساسي أكثر من الهواتف الذكية. تعمل معالجات ARM في الأجهزة القابلة للارتداء باستهلاك طاقة يبلغ بضعة واتات فقط، مع ندرة تجاوز ذاكرة الوصول العشوائي لجيجابايت واحد. للمقارنة: معظم نماذج تحويل النص إلى كلام الحديثة تزن ما بين 300 ميجابايت وعدة جيجابايتات وتتطلب معالج رسوميات جيد أو على الأقل معالج هاتف محمول سريع. للتوافق مع قيود الأجهزة القابلة للارتداء مع الحفاظ على جودة كلام مقبولة، يلزم إما تكميم عدواني للأوزان حتى 4 بت وأقل، أو معمارية غير قياسية مستقلة عن العمليات الحسابية المصفوفية الثقيلة. لم تكشف الشركة عن تفاصيل تقنية حتى الآن، لكن مجرد التصريح بدعم الساعات الذكية يضع معياراً هندسياً طموحاً.

يضيف فتح النموذج قيمة استراتيجية. يعمل اللاعبون التجاريون الرئيسيون في مجال الذكاء الاصطناعي للكلام—ElevenLabs و PlayHT و OpenAI TTS—حصرياً عبر واجهات برمجة التطبيقات السحابية. تنشر Mistral النموذج للنشر المحلي. هذا يفتح حالات استخدام حيث تكون السحابة غير مقبولة: الأجهزة الطبية ذات متطلبات السرية، الأنظمة المؤسسية بدون الحق في إرسال البيانات خارج المحيط، أجهزة إنترنت الأشياء في المناطق الخالية من الإنترنت المستقر، الأنظمة المدمجة في المواصلات والمعدات الصناعية.

بالنسبة لمطوري تطبيقات الهاتف المحمول والأجهزة القابلة للارتداء، يفتح هذا الإصدار فئة كاملة من المنتجات. يمكن لمساعدات الكلام أن تعمل بشكل كامل بدون إنترنت. تطبيقات القراءة الصوتية يمكنها توليد صوت بدون اشتراك في خدمة تابعة لجهة خارجية وبدون تأخيرات الشبكة. أدوات إمكانية الوصول للأشخاص الذين يعانون من ضعف البصر يمكنها أن تعمل بدون اتصال مستمر. تطبيقات الملاحة والمترجمات والمتحدثات الذكية—جميعها تحصل على القدرة على إنتاج إخراج صوتي عالي الجودة بدون اعتماد على السحابة.

توجد بدائل تحويل النص إلى كلام مفتوحة المصدر بالفعل في السوق: Piper TTS و StyleTTS2 و Coqui. البعض يعمل بشكل مقبول على وحدة المعالجة المركزية، والبعض الآخر يتطلب معالج رسوميات أو يقل عن الأنظمة التجارية من حيث الطبيعة الصوتية. تمثل Mistral مستوى مختلفاً من الاعتراف والثقة في مجتمع المطورين. أثبتت الشركة قدرتها على إنشاء نماذج مضغوطة بجودة تتجاوز التوقعات. إذا تابع نموذج الكلام نفس النمط، قد يتغير سوق تحويل النص إلى كلام مفتوح المصدر بشكل كبير.

يندرج هذا الإصدار ضمن الاستراتيجية العامة للشركة. تقوم Mistral بالتموضع باستمرار كبديل أوروبي لعمالقة الذكاء الاصطناعي الأمريكيين والصينيين، مراهنة على الانفتاح والاستقلالية عن منصات معينة. نموذج كلام لأجهزة الحافة يستمر في هذا المسار: الذكاء الاصطناعي مباشرة على الجهاز، بدون وسطاء، بدون اشتراكات، تحت سيطرة المطور.

ZK
Hamidun News
أخبار الذكاء الاصطناعي بدون ضوضاء. اختيار تحريري يومي من أكثر من 400 مصدر. منتج من جمال حميدون، رئيس الذكاء الاصطناعي في Alpina Digital.

هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟

AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.

ما رأيك؟
جارٍ تحميل التعليقات…