Google تكشف عن STATIC: بحث توليدي أسرع 948 مرة
قدمت Google AI إطار STATIC، وهو إطار عمل قائم على المصفوفات المتفرقة يسرّع فك الترميز المقيّد في أنظمة التوصية التوليدية بمقدار 948 مرة. وتعالج هذه التقنية…
معالج بواسطة الذكاء الاصطناعي من MarkTechPost؛ بتحرير Hamidun News
أنظمة التوصيات التي تحدد ما تراه في خلاصتك على YouTube أو Google Play أو أي خدمة كبرى أخرى تقف على عتبة تحول جذري. بدلاً من النهج الكلاسيكي القائم على البحث عن أقرب الجيران في فضاء التضمين، تقوم الصناعة بتجارب متزايدة مع الاسترجاع التوليدي — حيث يقوم نموذج لغة كبير مباشرة بـ "اختراع" معرفات العناصر المناسبة. قدمت Google AI للتو إطار عمل STATIC الذي يحل إحدى أصعب المشاكل في هذا النهج ويفعل ذلك بتسريع مذهل — 948 مرة أسرع.
لفهم أهمية هذا العمل، يجب فهم السياق. الاسترجاع التوليدي (GR) هو نموذج يتم فيه ترميز كل عنصر في الكتالوج — سواء كان فيديو أو منتج أو مقالة — كما يسمى معرف دلالي (Semantic ID)، أي تسلسل من الرموز المنفصلة. يتم تدريب نموذج اللغة على توليد هذه التسلسلات بطريقة توليدية ذاتية، رمز تلو الآخر، بطريقة مماثلة لكيفية توليد GPT للنصوص. يبدو أنيقاً، لكن في الممارسة العملية ينشأ عائق خطير: أنظمة التوصيات الصناعية لا تعمل في الفراغ. تفرض منطق الأعمال قيوداً صارمة — يجب أن يكون المحتوى طازجاً، وأن يتوافق مع اللوائح الإقليمية، وألا ينتهك التصنيفات العمرية، وأن يأخذ في الحسبان اتفاقيات الترخيص. لا يمكن للنموذج ببساطة توليد المعرفات بحرية — يجب التحقق من كل خطوة فك ترميز للامتثال لهذه القيود.
هنا بالضبط حيث تبدأ المشاكل. فك الترميز المقيد (constrained decoding) في التطبيقات الحالية يعمل ببطء مؤلمة. في كل خطوة توليد، يجب على النموذج أن يتحقق من مقابل مجموعة ضخمة من المتابعات الصحيحة، وتصفية الخيارات غير الصحيحة وإعادة توزيع الاحتمالات. مع الفهارس التي تحتوي على عشرات الملايين من العناصر والقيود التوليفية المعقدة، يصبح هذا كابوساً حسابياً. استخدمت الأساليب السابقة هياكل بيانات شجرية — أشجار بادئة (tries) — لكنها تتسع بشكل سيء عند فرض قيود متعددة متداخلة وهي عملياً غير مناسبة للمعالجة الموازية الفعالة على GPU.
يوفر STATIC (Sparse maTrix frAmework for consTraIned deCoding) نهجاً مختلفاً بشكل جذري. بدلاً من المرور عبر الأشجار، يترجم الإطار كل منطق القيد إلى لغة عمليات المصفوفة المتناثرة. يتم تمثيل كل قيد — سواء كان مرشحاً حسب تاريخ النشر أو الجغرافيا أو الفئة — كمصفوفة متناثرة، وتقل مجموعتهم إلى عمليات مصفوفة قياسية: الضرب والتقاطع والاتحاد. يوفر هذا ميزتين حاسمتين. أولاً، عمليات المصفوفة المتناثرة محسنة بشكل مثالي على GPU و TPU الحديثة — عقود من العمل على الجبر الخطي في التعلم الآلي أنشأت بنية تحتية قوية لهذا. ثانياً، يسمح هذا النهج بدمج أي عدد من القيود بأناقة دون النمو الأسي في التعقيد.
يستحق رقم التسريع البالغ 948 مرة تعليقاً منفصلاً. في بحوث التحسين، غالباً ما يتم مصادفة مضاعفات مثيرة للإعجاب والتي تتبين أنها نتيجة المقارنة مع حل أساسي ضعيف بقصد. ومع ذلك، في حالة STATIC، نتحدث عن المقارنة مع طرق حقيقية مستخدمة في الإنتاج لفك الترميز المقيد. مثل هذا الترتيب من التسريع يعني أن العملية التي استغرقت دقائق تناسب الآن أجزاء من الثانية — وهذا هو الفرق بين التكنولوجيا المثيرة للاهتمام نظرياً والتكنولوجيا المطبقة عملياً.
قد تكون الآثار المترتبة على صناعة أنظمة التوصيات مهمة جداً. حتى الآن، ظلت استرجاع المحتوى التوليدي إلى حد كبير مفهوماً بحثياً بالضبط بسبب صعوبة الوفاء بقيود الأعمال في الوقت الفعلي. لم تتمكن الشركات التي تدير فهارس تضم مئات الملايين من العناصر من تحمل تأخيرات في فك الترميز. يزيل STATIC احتمالياً هذا القيد، مما يفتح الطريق لاستبدال نماذج البرجين التقليدية مع البحث التقريبي عن الجيران الأقرب بخطوط أنابيب توليدية بالكامل. وهذا بدوره قد يحسن جودة التوصيات — نماذج توليدية قادرة على التقاط أنماط أكثر تعقيداً من تفضيلات المستخدم من embeddings الثابتة.
هناك أيضاً سياق أوسع. فك الترميز المقيد ليس مشكلة حصرية لأنظمة التوصيات. يحدث في التوليد النصي المنظم، في الأنظمة حيث يجب على نماذج اللغة إخراج JSON صحيح، أو استعلامات SQL، أو كود يتوافق مع الهياكل النحوية الرسمية. إذا أثبتت طريقة STATIC أنها قابلة للتعميم، فقد تجد مبادئها تطبيقاً يتجاوز التوصيات بكثير.
تستمر Google في تحويل نماذج اللغة بشكل منهجي من أدوات توليد النصوص إلى محركات حوسبة عالمية. STATIC ليس إعلاناً صاخباً عن روبوت محادثة جديد، بل هو ابتكار بنية تحتية يمكن أن يغير بهدوء، لكن بشكل جذري، بنية الأنظمة التي يتفاعل معها مليارات المستخدمين يومياً. إنه بالفعل هذا النوع من العمل — لم يلاحظه الجمهور العام لكنه حرج بالنسبة للمهندسين — الذي في النهاية يحدد ذكاء وسرعة الخدمات التي نستخدمها.
هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟
AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.