MarkTechPost→ المصدر

كشفت ميرا موراتي عن أول نظام لحوار طبيعي مع AI في الوقت الفعلي

قدمت مختبرات ميرا موراتي Thinking Machines نموذج TML-Interaction-Small، وهو نموذج يضم 276 مليار معلمة. يعالج النظام الصوت والفيديو والنص في الوقت نفسه، ضمن مقاط

كشفت ميرا موراتي عن أول نظام لحوار طبيعي مع AI في الوقت الفعلي
المصدر: MarkTechPost. كولاج: Hamidun News.
◐ استمع للمقال

التفكير والاستماع في نفس الوقت — هذا شيء لم تستطع معظم أنظمة الذكاء الاصطناعي القيام به حتى الآن. قدمت Thinking Machines Lab، مختبر ميرا موراتي، النموذج الأول الذي يغير هذه القاعدة. يعمل نموذج TML-Interaction-Small مثل حوار حقيقي بين الناس: فهو يستمع إليك ويحضر إجابة في نفس الوقت.

كيف تعمل البنية المعمارية متعددة الخيوط

TML-Interaction-Small هو نموذج يحتوي على 276 مليار معامل، حيث يكون نشطًا منها 12 مليار فقط (صيغة Mixture-of-Experts). الفرق المعماري الرئيسي: يعالج النظام الصوت والفيديو والنص في نفس الوقت، في تدفق بيانات واحد. تُقسَّم جميع بيانات الإدخال إلى أجزاء مدتها 200 ميلي ثانية — وهو الوقت الكافي تماماً لكي يبقى النموذج متزامناً مع المحادثة الحقيقية وينسجم مع إيقاع الكلام البشري. تفصيل آخر: يعمل النظام بدون وحدات خارجية لكشف نشاط الصوت (voice-activity detection). عادةً ما تصبح هذه الوحدات نقطة اختناق — فهي تضيف تأخيراً وتعقد البنية المعمارية. هنا، كل شيء مدمج مباشرة في الشبكة العصبية نفسها. يزيل هذا التأخيرات غير الضرورية ويجعل النظام أكثر استجابة وحيوية بكثير.

محركات متوازية لمهام مختلفة

يعمل النظام بمكونين متوازيين. الأول — real-time interaction model — مسؤول عن الحوار المباشر مع المستخدم ويضمن تبادل المعلومات ثنائي الاتجاه الكامل (يمكنك مقاطعة النظام والتحدث في نفس الوقت). المكون الثاني — asynchronous background model — يفكر في الخلفية، ويعمل مع الأدوات الخارجية وقواعس البيانات، لديه دائماً وصول كامل إلى سياق المحادثة.

  • يتعامل المحرك الأول مع الإجابات السريعة في الوقت الفعلي
  • يوفر المحرك الثاني التفكير العميق والعمليات المعقدة
  • كلا المكونين يرى ويفهم السياق الكامل لكامل المحادثة
  • الإدراك لا يتجمد أثناء توليد الإجابة
  • معالجة المعلومات تحدث في تدفق مستمر، وليس في مراحل منفصلة

الثورة من المعالجة التسلسلية إلى المعالجة المتوازية

يعمل تقريباً جميع مساعدات الذكاء الاصطناعي الحديثة وفق نظام متسلسل: تنهي الحديث → يجمد النظام الإدراك → يعالج الكلمات → ينتج إجابة جاهزة. يكسر TML-Interaction-Small هذا المنطق. فهو يستمع إلى المستخدم وفي نفس الوقت يحضر إجابة، مثل حوار حقيقي بين شخصين. يتطلب مثل هذا النهج بنية معمارية مختلفة تماماً. بدلاً من اللحظات المنفصلة، يعالج النظام البيانات متعددة الأنماط كتدفق مستمر. يسمح هذا للنموذج بالتقاط التنغيم والفواصل والمشاعر وسياق المحادثة. نتيجة لذلك، لا يبدو مساعد الذكاء الاصطناعي روبوتياً بل يبدو وكأنه شريك محادثة حي.

ماذا يعني هذا للتفاعل

هذه هي الخطوة العملية الأولى نحو حوار طبيعي حقاً بين البشر والذكاء الاصطناعي. بدلاً من انتظار الإجابة التالية، ستتمكن من مقاطعة واستيضاح والاعتراض — التفاعل كما مع مستشار حقيقي. بالنسبة للشركات، يعني هذا فرصاً جديدة لإنشاء مساعدين يبدون أحياء، وليس باردين وبعيدين.

ZK
Hamidun News
أخبار الذكاء الاصطناعي بدون ضوضاء. اختيار تحريري يومي من أكثر من 400 مصدر. منتج من جمال حميدون، رئيس الذكاء الاصطناعي في Alpina Digital.
ما رأيك؟
جارٍ تحميل التعليقات…