Amazon Nova: بيانتك الآن تفهم بعضها البعض بدون كلمات أو علامات
هل تتذكر تلك الأوقات عندما كان البحث في أرشيف الفيديو يتحول إلى تمرير لا نهائي للخطوط الزمنية أو الأمل في أن يكون قد أضاف أحد المتدربين الوسوم بشكل صحيح؟…
معالج بواسطة الذكاء الاصطناعي من AWS Machine Learning Blog؛ بتحرير Hamidun News
هل تتذكر تلك الأوقات عندما كان البحث في أرشيف الفيديو يتحول إلى تمرير لا نهائي للخطوط الزمنية أو الأمل في أن يكون قد أضاف أحد المتدربين الوسوم بشكل صحيح؟ قررت أمازون أن الوقت قد حان لإنهاء هذا. بينما يناقش الجمهور العام ما إذا كانت روبوتات الدردشة تفهم السخرية، أطلقت فرق AWS بصمت Nova Multimodal Embeddings — أداة تجعل النصوص والصور والفيديو تتحدث لغة واحدة من المتجهات. هذا ليس مجرد تحديث سحابي آخر، بل محاولة لجعل البحث ذكياً حقاً، دون إجبار الناس على كتابة البيانات الوصفية يدوياً لكل ملف.
قبل وصول Nova، كانت الصناعة تعيش في عالم الحلول المؤقتة. للعثور على المنتج المناسب في متجر إلكتروني من خلال صورة أو تحديد موضع فتاة محددة في فيلم طويل الأمد، كان يجب استخدام إما بحث بدائي حسب الأسماء أو سلاسل معقدة من الشبكات العصبية التي غالباً ما تتضارب مع بعضها. راقبت أمازون لفترة طويلة كيف استحوذت بنية CLIP من OpenAI على عقول المطورين، وقررت إطلاق إجابتها الخاصة، محسّنة لاحتياجات المؤسسات والبنية التحتية السحابية. الآن أصبحت التعددية الوسائط معياراً فعلياً لأي مشروع جاد.
ماذا يحدث فعلياً تحت غطاء هذا النظام؟ تحول Nova أي بيانات وسائط إلى قوائم طويلة من الأرقام — ما يسمى بـ embeddings. يكمن السحر في أن الكائنات المتشابهة دلالياً تنتهي قريبة من بعضها البعض في هذا الفضاء الرياضي. إذا قمت بتحميل صورة دراجة جبلية وكتبت "رياضات متطرفة في الطبيعة"، ستفهم النموذج أنها مرتبطة ارتباطاً وثيقاً، حتى لو لم تشترك الوصف النصي في أي كلمات مشتركة مع اسم الملف. علاوة على ذلك، تستطيع Nova العمل مع الفيديو، محللة ليس فقط الإطارات الفردية بل ديناميكية الحركة، وهو ما كان يتطلب سابقاً قوة حسابية ضخمة وخطوط أنابيب منفصلة.
لماذا نحتاج هذا نحن والشركات؟ أولاً، يقلل بشكل جذري من تكلفة تطوير أنظمة التوصيات. الآن لا تحتاج شركة ناشئة صغيرة إلى توظيف جيش من المشرفين لتعليق المحتوى. ثانياً، يغيّر بشكل أساسي تجربة المستخدم. تخيل أنك تستطيع ببساطة تحميل لقطة شاشة من فيلم في محرك بحث متجر والعثور على الفور على المعطف الذي كان يرتديه الشخصية، دون الحاجة إلى البحث عن العلامة التجارية. تراهن أمازون على أن البيانات هي النفط الجديد، لكن فقط إذا كنت تعرف كيفية العثور بسرعة على البئر الصحيحة في محيط من الفضاء الرقمي.
بالطبع، هناك أيضاً حساب استراتيجي هنا. إنها طريقة للاحتفاظ بالعملاء داخل AWS. يجعل تكامل Nova مع قواعد بيانات المتجهات مثل OpenSearch الانتقال إلى السكك الجديدة سلساً تقريباً لمن يخزنون بالفعل تيرابايتاتهم على خوادم جيف بيزوس. بينما تحاول Google Gemini المنافسة في الإبداع، تركز أمازون على المهام المطبقة في البيع بالتجزئة والخدمات اللوجستية وإدارة المعرفة، حيث تتحول كل نقطة مئوية محفوظة من دقة البحث إلى ملايين حقيقية من الإيرادات.
النقطة الأساسية: عصر البحث حسب الكلمات الرئيسية قد انتهى رسمياً. الآن تفهم الآلات جوهر المحتوى، وليس فقط اسمه. هل سيتمكن Google من الحفاظ على قيادته في البحث عندما تصبح مثل هذه الأدوات متاحة لأي مطور في بضع نقرات في وحدة تحكم AWS؟
هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟
AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.