MarkTechPost→ المصدر

Perplexity تطلق pplx-embed: نماذج التضمين التي تغيّر قواعد البحث

أطلقت Perplexity pplx-embed، وهي مجموعة من نماذج التضمين متعددة اللغات والمحسّنة للبحث على نطاق الويب. تعتمد النماذج على معمارية Qwen3، لكن مع اختلاف رئيسي…

معالج بواسطة الذكاء الاصطناعي من MarkTechPost؛ بتحرير Hamidun News
Perplexity تطلق pplx-embed: نماذج التضمين التي تغيّر قواعد البحث
المصدر: MarkTechPost. كولاج: Hamidun News.
◐ استمع للمقال

شركة Perplexity، التي تحولت على مدى السنتين الماضيتين من شركة ناشئة متخصصة في البحث إلى أحد أبرز اللاعبين في صناعة الذكاء الاصطناعي، اتخذت خطوة أخرى مهمة من الناحية الاستراتيجية. أطلقت الشركة pplx-embed — عائلة من نماذج التضمين متعددة اللغات التي تؤسس، وفقاً لقول المطورين، معياراً جديداً للجودة في مهام استرجاع المعلومات على نطاق الإنترنت بأكمله. إذا كانت Perplexity في السابق بشكل أساسي مستهلكة لنماذج الآخرين، فإنها الآن تؤكد بشكل متزايد على نفسها كمنشئة لبنيتها التحتية الخاصة.

لفهم أهمية هذا الإطلاق، من المفيد فحص ماهية التضمينات ولماذا تعتبر حرجة الأهمية. التضمين هو تمثيل رقمي للنص في فضاء متعدد الأبعاد — نوع من البصمات الرياضية لمعنى النص. عندما تدخل استعلاماً في محرك بحث، فإن نموذج التضمين هو الذي يحدد أي المستندات قريبة دلالياً من سؤالك. تؤثر جودة هذا النموذج بشكل مباشر على مدى ملاءمة النتائج التي تحصل عليها. حتى الآن، ظلت الحلول المملوكة من OpenAI وCohere وGoogle هي المعيار الذهبي في هذا المجال، بينما من بين النماذج المفتوحة، قادت التطورات من الصين والمشاريع المنفصلة مثل E5 من Microsoft.

يتم بناء Pplx-embed على معمارية Qwen3، لكن مع تعديل جذري. تستخدم معظم نماذج اللغة الحديثة الانتباه السببي (أحادي الاتجاه) — فهي تقرأ النص من اليسار إلى اليمين، كما يقرأ الشخص كتاباً، وكل رمز "يرى" فقط ما جاء قبله. يعمل هذا بشكل رائع لتوليد النص، لكنه بالنسبة لمهام التضمين قيد خطير. عند إنشاء تمثيل شامل لمستند، يجب على النموذج أن يأخذ في الاعتبار السياق في كلا الاتجاهين — كل من ما يأتي قبل الكلمة وما يأتي بعدها. حلت Perplexity هذه المشكلة بتحويل المعمارية إلى انتباه ثنائي الاتجاه، وبشكل أساسي العودة إلى الأفكار المطروحة في BERT، لكن على مستوى نوعي جديد من الحجم والتعقيد.

الابتكار الرئيسي الثاني هو استخدام نهج الانتشار في عملية إنشاء التضمينات. لم يتم الكشف بالكامل عن تفاصيل التنفيذ بعد، لكن المبدأ نفسه مستعار من نماذج الصور التوليدية: بدلاً من الحصول على تمثيل النص في تمرير واحد، يقوم النموذج بتحسينه بشكل متكرر، مما يؤدي تدريجياً إلى "تنظيف" الضوضاء. للعمل مع بيانات الويب الحقيقية، التي تكون بطبيعتها مشوشة — الترميز المكسور، وإدراج الإعلانات، والمحتوى المكرر، ومزيج من اللغات — قد يكون مثل هذا النهج ميزة حاسمة. إن المتانة تجاه الضوضاء هي ما يميز نموذجاً يعمل بشكل جيد على المقاييس النظيفة عن نموذج يتعامل مع فوضى الإنترنت الحقيقية.

تستحق الطبيعة متعددة اللغات لـ pplx-embed اهتماماً خاصاً. تم تدريب Qwen3، التي تقوم عليها النموذج، في الأصل على بيانات بأكثر من مائة لغة، وحافظت Perplexity على ما يبدو على هذه الخاصية وعززتها. بالنسبة لشركة منتجها البحثي يعمل عالمياً، هذا ليس مجرد مكافأة ممتعة بل ضرورة تشغيلية. يجب على مستخدم من طوكيو أو موسكو أو ساو باولو أن يحصل على نتائج ذات جودة متساوية، وهو نموذج تضمين متعدد اللغات واحد هو الطريقة الأكثر أناقة لتحقيق ذلك.

السياق الاستراتيجي لهذا الإطلاق لا يقل أهمية عن الجوانب التقنية. ظلت Perplexity لفترة طويلة تعتمد على موردي النماذج الخارجيين — OpenAI للتوليد، ومختلف الموردين للتضمينات. كل مثل هذه التبعية هي في الوقت نفسه خطر مالي وسقف للتحسين. بإطلاق نماذج التضمين الخاصة بها، تحصل Perplexity على السيطرة الكاملة على حلقة رئيسية في خط أنابيب البحث لديها. يمكنها ضبط النماذج لاحتياجاتها المحددة، وتحسين زمن الكمون وتكلفة الاستدلال، والأهم من ذلك، التوقف عن الدفع مقابل كل استدعاء API للمنافسين. بالنسبة لشركة تعالج ملايين استعلامات البحث يومياً، يمكن أن تصل المدخرات إلى ملايين الدولارات سنوياً.

بالنسبة للصناعة الأوسع، يشير هذا الإطلاق إلى اتجاه مهم: يتسارع التكامل الرأسي في الذكاء الاصطناعي. تبدأ الشركات التي بدأت كـ "أغلفة" حول نماذج الآخرين واحدة تلو الأخرى في بناء أكوامها الخاصة. تتبع Perplexity مساراً مشى فيه آخرون بالفعل — من استهلاك واجهات برمجية التطبيقات إلى إنشاء نماذجها الخاصة، من التبعية إلى الاستقلالية. حقيقة أن النماذج تتموضع كبدائل جاهزة للإنتاج لواجهات برمجية التطبيقات المملوكة تشير إلى أن Perplexity ليست تحل مهامها الداخلية فقط، بل تنظر أيضاً إلى سوق خدمات البنية التحتية للذكاء الاصطناعي.

Pplx-embed ليست ثورة بل خطوة تطورية منطقية، لكنها خطوة كاشفة جداً. توضح Perplexity أنها مستعدة للتنافس ليس فقط على مستوى منتج المستخدم النهائي بل أيضاً على مستوى التقنيات الأساسية. إذا تم تأكيد جودة SOTA المطالب بها من خلال معايير مستقلة، ستواجه OpenAI وGoogle منافساً جاداً آخر — وبالضبط حيث يؤلم الأكثر: في البنية التحتية التي يتم بناء كل بحث ذكاء اصطناعي حديث عليها.

ZK
Hamidun News
أخبار الذكاء الاصطناعي بدون ضوضاء. اختيار تحريري يومي من أكثر من 400 مصدر. منتج من جمال حميدون، رئيس الذكاء الاصطناعي في Alpina Digital.

هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟

AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.

ما رأيك؟
جارٍ تحميل التعليقات…