عرضت Habr AI كيف تقلل معمارية الأنعكاس لوكلاء LLM التأخير إلى 60 FPS
عرضت Habr AI كيفية حل المشكلة الرئيسية لوكلاء الذكاء الاصطناعي في الألعاب والمساعدات والروبوتات — تأخير بمقدار 1–3 ثواني. قسمت الفريق النظام إلى حلقة سريعة…
معالج بواسطة الذكاء الاصطناعي من Habr AI؛ بتحرير Hamidun News
نشر Habr AI تحليلاً لعمارة تضيف لوكلاء LLM "حبلاً شوكياً" — طبقة سريعة من المنعكسات فوق التفكير البطيء. الفكرة هي إزالة الوقفة المألوفة لمدة 1–3 ثوان وجعل شخصيات NPC في الألعاب والمساعدين الصوتيين والروبوتات تستجيب بشكل فوري تقريباً.
أين تفشل السرعة
تلك مشكلة مألوفة لكل من حاول دمج نموذج لغة كبير في بيئة تفاعلية. بينما يتلقى الوكيل الصوت ويجمع السياق ويرسل طلباً وينتظر استجابة النموذج ويحولها إلى حركة أو إجراء، يمر وقت طويل جداً. بالنسبة للدردشة، مثل هذا التأخير محتمل، لكن بالنسبة للعبة أو روبوت أو واجهة حية، فهو بالفعل فشل في تجربة المستخدم: المستخدم يرى ليس الذكاء بل التجميد.
ولهذا السبب حتى النموذج القوي يبدو في كثير من الأحيان "ذكي لكنه بطيء". يقارن المؤلفون مثل هذا الدمج بمحاولة وضع محرك المكوك على عربة: القوة الحسابية موجودة، لكن ترجمتها إلى سلوك حقيقي لا تعمل. في النموذج الأولي لهم، انتقل اهتمام الجمهور إلى الغلاف البصري، وليس إلى المحرك نفسه.
بدلاً من مناقشة الاستدلال، سمعت الفريق شكاوى بشأن مخرجات التصحيح الخام وجودة الإطارات. أي أن النقاش كان حول الصورة، بينما الخبر الحقيقي هو أن النظام كان يحاول بالفعل الحفاظ على إيقاع الوقت الفعلي.
"من المبكر جداً إظهار '60 إطار في الثانية حقيقي'. لديك فقط منظار ملون
من الإطارات الفوضوية والضبابية والأصابع الملتوية."
النظام 1 والنظام 2
أصبح الحل Dual-Process Architecture — تقسيم الوكيل إلى حلقات سريعة وبطيئة. تعمل الطبقة الأولى كنظام انعكاسي: تراقب الأحداث وتطلق ردود فعل فورية دون انتظار التفكير الكامل للنموذج. تبقى الطبقة الثانية مع LLM وتتعامل مع المهام الأكثر تكلفة: تفسير السياق المعقد والتخطيط واختيار الردود وإعادة تشكيل السلوك. بهذه الطريقة، يمكن للوكيل أن يرد أولاً ثم "يفكر"، كما يفعل البشر في العالم الحقيقي.
في هذا النهج، من الحرج عدم إجبار LLM على أن يكون مركز التنفيذ الوحيد. التفكير البطيء جيد حيث يكون العمق مطلوباً، لكنه غير مناسب للحركات والإيماءات الدقيقة ودورات الكاميرا السريعة والاستجابة للاصطدامات أو الردود الصوتية القصيرة. تحل معمارية السرعتين هذا الصراع: تعيش واجهة وجسد الوكيل في أجزاء من الثانية، بينما يعمل المعنى والاستراتيجية في دورة أطول.
يسمح هذا الفصل بعدم فقدان الإطارات وعدم إجبار المستخدم على الانتظار لكل إيماءة أو رد قادم. وفقاً لوصف المؤلفين، توفر هذه الخطة أيضاً ميزتين يصعب الحصول عليهما في خط أنابيب أحادي اللون: يمكن تغيير الشخصية في الوقت المناسب وتبني الأنماط السلوكية الجديدة أثناء التشغيل. هذا مهم بشكل خاص لشخصيات NPC والمساعدين والروبوتات، حيث يجب على الوكيل ليس فقط الرد بل التكيف المستمر مع البيئة.
في مخطط معياري، تتطلب مثل هذه التغييرات طلباً جديداً إلى النموذج وتصطدم مرة أخرى بجدار التأخير.
التأثير العملي للنهج
إذا استخرجت المنعكسات من حلقة LLM الثقيلة، فإن هذا يغير ليس فقط التأخير بل أيضاً الشعور بـ "الحياة" للنظام. يتوقف المستخدم عن انتظار انتهاء الذكاء من مرور كامل عبر السلسلة ويبدأ في رؤية سلوك مستمر. بالنسبة لفرق المنتجات، هذا تحول مهم: يتم تقييم جودة الوكيل الآن ليس من خلال جمال إطار العرض التوضيحي بل من خلال مدى طبيعية الحفاظ على إيقاع التفاعل. في المنتج التفاعلي، غالباً ما يكون هذا أكثر أهمية من النص المثالي، لأن الشعور بالحضور ينهار قبل أن يتاح للمستخدم وقت لتقييم عمق الرد.
- ردود فعل فورية على الأحداث والأصوات والعوائق والأوامر
- اتصال سلس بين الإنشاء والحركة والتحكم
- التبديل السريع بين الدور والشخصية أو نمط الرد
- التعلم وتصحيح السلوك دون إعادة تشغيل كاملة للوكيل
بشكل أساسي، يقترح الفريق عدم النظر إلى LLM على أنه الدماغ الوحيد للنظام، بل كواحدة من طبقاته. هذا يغير منظور الهندسة: بدلاً من معركة لا نهاية لها مع تأخير الشبكة والاستدلال الثقيل، تظهر فرصة لتصميم محرك منفصل لأداء الوقت الفعلي. نعم، قد تكون تصور النموذج الأولي خام. لكن إذا كانت طبقة المنعكس تحافظ بالفعل على الإيقاع، فيمكن القيام بتلميع الرسومات والأيدي والإطارات في التكرار التالي.
ماذا يعني هذا
توضح القصة جيداً إلى أين تتجه وكلاء الذكاء الاصطناعي: نحو الأنظمة الهجينة حيث يتم فصل المنعكسات السريعة عن التفكير البطيء. بالنسبة لأولئك الذين يصنعون الألعاب والمساعدين الصوتيين والذكاء الاصطناعي الجسدي، هذا يقريباً خطوة إلزامية — دونه، حتى أفضل LLM سيبدو بطيئاً وغير بارع.
هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟
AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.