Маори разработали собственный синтезатор речи и защитили его от Big Tech скрейпинга
Профессор Te Taka Keegan и его команда разработали синтезатор речи для маорийского диалекта Waikato-Maniapoto. Модель была обучена на 7 часах 45 минут записей п
معالج بواسطة الذكاء الاصطناعي من IEEE Spectrum AI؛ بتحرير Hamidun News
طورت مجتمعات الماوري في نيوزيلندا مركب تحويل نصوص إلى كلام خاص بهم يتحكمون فيه بالكامل. وهذه خطوة أولى نحو السيادة الرقمية، حيث تبقى اللغة ملكية للأشخاص الذين يتحدثونها.
الاستخلاص بدون إذن
يتحدث ChatGPT و Claude و Perplexity لغة الماوري بامتياز. يستطيعون فعل ذلك لأنهم تم تدريبهم على بيانات من مجتمعات الماوري — نصوص وملفات صوتية تم استخلاصها بدون إذن. يرى البروفيسور تي تاكا كيجان من جامعة وايكاتو أن هذا هو المشكلة الرئيسية: "تمتلك هذه الشركات الموارد اللازمة لإنشاء نماذج جيدة، لكنها استخلصت جميع البيانات بدون مشاركتنا، ولا نملك النتيجة. لغتنا هي الطريقة الرئيسية لنقل معرفتنا، والتكنولوجيا المطورة خارج أوتياروا تسيطر بشكل متزايد على هذا النقل."
لماذا لغة الماوري أصعب من الإنجليزية
لغة الماوري لا تشبه الإنجليزية، وهذا يخلق مشاكل للذكاء الاصطناعي. تجعلها عدة خصائص لغوية صعبة بشكل خاص على الأتمتة:
- طول الحرف العلة يغير معنى الكلمة: keke — "كعكة"، kēkē — "الإبط"، kekē — "يصرير"
- الثنائيات الحرفية لا تُنطق كما هو الحال في الإنجليزية: "wh" تُنطق كـ "f"
- وهي لغة محدودة الموارد بها عدد قليل من النصوص والتسجيلات المتاحة بصيغة رقمية
لحل هذه المشكلة، دعا كيجان نجارينجي كاتيبا — مترجمة ومدرسة لغة الماوري. أولاً، سجلوا 4.5 ساعات من قراءتها، ثم قاما بتوسيع مجموعة البيانات بمساعدة اللغوي بيتر كيجان (أخو تي تاكا) إلى إجمالي نهائي قدره 7 ساعات و 45 دقيقة.
الفونيمات بدلاً من الأحرف
اختار كيجان وطالبه الدراسات العليا كينجسلي إنج منهجاً فونيمياً — يتم تدريب النموذج ليس على الأحرف بل على الأصوات. أعطى هذا النموذج "ميزة في التعلم": فهو يفهم فوراً كيف تبدو مجموعات الأحرف. اختبروا ثلاث بنى معمارية مفتوحة المصدر (Matcha-TTS و Tacotron2 و Piper) واختاروا Piper لأنه يعمل في الوضع غير المتصل على جهاز كمبيوتر محلي.
تجاوزت النتائج التوقعات. مع أقل من 8 ساعات من التسجيلات، حقق النموذج معدل خطأ قدره 6.78% — وهو يُعتبر نتيجة "جيدة" في الصناعة حيث تُطلب عادة مئات الساعات.
عندما استمع 68 متحدثاً أصلياً للغة الماوري إلى أصوات اصطناعية وبشرية وحاولوا التمييز بينها، خمنوا بشكل صحيح في 65% فقط من الحالات. يشرح كيجان: "نحن راضون لأن البعض كانوا أقارب للصوت الأصلي ويعرفونه جيداً، لكن حتى هم أخطأوا."
من الجامعة إلى المجتمع
بدلاً من إطلاق النموذج في وصول مفتوح، يتفاوض كيجان مع ثلاثة إيوي — قبائل الماوري (وايكاتو ومانيابوتو وراوكاوا) التي ترتبط بها كاتيبا. "يجب أن تكون الوصاية على هذا معهم وليس مع الجامعة," يقول البروفيسور. يرى فيه تجسيداً لمبدأ يدعوه الماوري "كايتياكيتانجا" — حماية المعرفة للأجيال القادمة. وهذا جزء من اتجاه عالمي. طورت منظمة الماوري تي هيكو ميديا نظام التعرف على الكلام بدقة 92% للغة الماوري و 82% للكلام ثنائي اللغة، وأطلقته بموجب ترخيص Kaitiakitanga الذي يحظر استخدام البيانات بدون فائدة لشعب الماوري.
ما يعنيه هذا
لا يخطط كيجان لـ "نموذج لغة الماوري الواحد"، بل نماذج منفصلة لكل لهجة: Maniapoto LLM و Tūhoe LLM وهكذا دواليك، كل منها يمتلكه شعبه الخاص ويتم تدريبه على أصواتهم. يخلق هذا نموذجاً للغات الأخرى الصغيرة في العالم: التوليف والملكية والحماية. عدم كونك موضوع استخلاص بيانات، بل أن تكون سيد تكنولوجيتك الخاصة.
هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟
AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.