Habr AI→ المصدر

Whisper لـ Teams: مطوّر أنشأ أداة لترجمة الكلام مباشرة أثناء الاجتماعات

وسط المعاناة المعتادة في المكالمات متعددة اللغات، ظهرت أداة DIY عملية: برنامج صغير يلتقط الصوت من الكمبيوتر، ويقسّمه إلى عبارات، ويمرّره عبر Whisper، ثم…

معالج بواسطة الذكاء الاصطناعي من Habr AI؛ بتحرير Hamidun News
Whisper لـ Teams: مطوّر أنشأ أداة لترجمة الكلام مباشرة أثناء الاجتماعات
المصدر: Habr AI. كولاج: Hamidun News.
◐ استمع للمقال

نشر موقع Habr تحليلاً لأداة صغيرة تساعد في فهم الاجتماعات باللغات الأجنبية دون تسجيل المكالمة. يقوم البرنامج بالتقاط الصوت المشغل على الكمبيوتر والتعرف على الكلام باستخدام Whisper وترجمته إلى اللغة المطلوبة.

لماذا تم إنشاء ذلك

كان الدافع وراء المشروع عملياً جداً: اجتماعات منتظمة في Teams مع زملاء باللغة الفرنسية. عندما تكون المحادثة سريعة ومعرفة اللغة تضعف، لا تُفقَد كلمات منفردة بل معنى أجزاء كاملة من النقاش. بدلاً من قبول هذا الوضع أو إعادة بناء السياق من شظايا بعد الاجتماع، بنى المطور أداة ترجمة منفصلة تعمل فوق تدفق الصوت الموجود أثناء كل اجتماع.

"لا يمكنك أن تطلب التسجيل في كل مرة." هذه هي القيمة العملية للفكرة.

لدى Teams والمنصات الأخرى بالفعل وظائف مدمجة للترجمة المكتوبة والنسخ والتسجيل، لكنها لا تكون متاحة دائماً في الإعدادات الصحيحة وغالباً ما تعتمد على منظم الاجتماع. تزيل الأداة الشخصية هذا الاعتماد: إذا كان الصوت يتم تشغيله على الكمبيوتر، فيمكن معالجته محلياً وتحويله إلى نص مفهوم باللغة المختارة دون تنسيق إضافي مع الزملاء.

كيفية عمل الأداة

بناءً على الوصف، يكون مسار عمل البرنامج مباشراً جداً. يأخذ تدفق الصوت المشغل، ويقسمه إلى عبارات فردية، ثم يمرر هذه الأجزاء عبر Whisper. يحصل المستخدم على الكلام المعترف به والترجمة كمخرجات، مع إمكانية اختيار اللغة الهدف مقدماً.

يلاحظ المؤلف على وجه التحديد أنه اختبره على الروسية والإنجليزية والفرنسية—إذن هذا ليس تجربة لمرة واحدة مع مسار صوتي واحد.

إنها هذه المنطق البسيط للأنبوب الذي يجعل المشروع مثيراً للاهتمام. لا توجد محاولة لبناء منصة مؤتمرات فيديو أخرى أو استبدال المجموعة المؤسسية. تحل الأداة مشكلة محددة: مساعدة شخص ما على البقاء في المحادثة عندما تكون اللغة الأصلية غير مريحة والاجتماع قد بدأ بالفعل. بالنسبة للاستخدام الشخصي، غالباً ما يكون هذا كافياً—خاصة عندما تكون هناك حاجة لترجمة سريعة دون طلب من الآخرين أو تعديلات من منظم الاجتماع.

ماذا يمكنها أن تفعل

من الواضح من الوصف أن المؤلف بنى ليس نموذج عرض توضيحي لمقالة، بل أداة عملية وفعلية لاحتياج حقيقي. تكمن قيمتها ليس في معمارية غير عادية، بل في كيفية اندماجها في سيناريو حقيقي: يستمع المستخدم ببساطة إلى الاجتماع بينما يحصل على الاعتراف والترجمة مفروضة على الصوت. بهذا الشكل، من السهل تخيل الأداة ليس فقط في الاجتماعات بل أيضاً في الندوات عبر الإنترنت وجلسات العروض التوضيحية والعروض التقديمية الداخلية.

  • التقاط تدفق الصوت المشغل بالفعل
  • تقسيم الكلام إلى عبارات فردية
  • الاعتراف والترجمة عبر Whisper
  • الاختبار على الروسية والإنجليزية والفرنسية

القيد الرئيسي واضح أيضاً: تعتمد جودة النتيجة بشكل مباشر على صفاء الصوت وسرعة الكلام وكيفية تقسيم البرنامج للتدفق إلى عبارات. لكن حتى مع هذه التحفظات، تبدو الفكرة مفيدة. بالنسبة للفرق الدولية، فإنها وسيلة لإضافة الترجمة المكتوبة الشخصية بسرعة حيث لا توفر المنصة نفسها مستوى التحكم المطلوب أو تتطلب إجراءات إضافية من منظم الاجتماع أثناء المكالمة.

ماذا يعني هذا

تُظهر قصة هذه الأداة جيداً إلى أين تتحرك أدوات الذكاء الاصطناعي عملياً. يأتي التأثير الأكثر وضوحاً ليس من المنتجات الشاملة الصارخة، بل من الحلول الصغيرة التي تعالج سيناريو متكرر—على سبيل المثال، مساعدة الفهم على الكلام الأجنبي في مكالمات العمل. في هذه الحالة، يعمل Whisper ليس كنموذج عرضي، بل كطبقة مفيدة ضمن مسارات العمل اليومية. وغالباً ما تظهر هذه الإضافات الصغيرة بشكل أسرع من الميزات الأصلية للخدمات الكبيرة.

ZK
Hamidun News
أخبار الذكاء الاصطناعي بدون ضوضاء. اختيار تحريري يومي من أكثر من 400 مصدر. منتج من جمال حميدون، رئيس الذكاء الاصطناعي في Alpina Digital.

هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟

AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.

ما رأيك؟
جارٍ تحميل التعليقات…