Habr AI→ المصدر

أوضحت Doubletapp لماذا تعيق مجموعات البيانات الضعيفة AI عن رفع NPS وCTR ومعدل التحويل

قالت Doubletapp إن فشل كثير من مشاريع AI لا يرتبط بالنموذج بقدر ما يرتبط ببيانات ضعيفة. وتؤثر مجموعة البيانات عالية الجودة في NPS للدعم وCTR ومعدل التحويل في…

معالج بواسطة الذكاء الاصطناعي من Habr AI؛ بتحرير Hamidun News
أوضحت Doubletapp لماذا تعيق مجموعات البيانات الضعيفة AI عن رفع NPS وCTR ومعدل التحويل
المصدر: Habr AI. كولاج: Hamidun News.
◐ استمع للمقال

نشرت Doubletapp مقابلة توضح السبب في فشل مشاريع الذكاء الاصطناعي في كثير من الأحيان لا على اختيار النموذج بل على البيانات. شرح إلنور فايزييف، رئيس وحدة Data LLM، كيف يؤثر جودة مجموعة البيانات بشكل مباشر على NPS الدعم وCTR الكتالوج وبمعدل تحويل الشراء.

حيث تضيع المقاييس

الفكرة الأساسية للمقابلة بسيطة: الأعمال لا تشتري نموذجاً كما هو، بل تشتري تحسناً في رقم معين. في الدعم، هذا هو سرعة حل المشاكل ورضا العميل؛ في البيع بالتجزئة عبر الإنترنت — قابلية النقر على البطاقات ونسبة الطلبات؛ في البحث في قاعدة المعرفة — دقة الإجابة. إذا تم جمع مجموعة بيانات بضوضاء أو تصنيف سيء أو بدون ارتباط بالسيناريوهات الحقيقية، يبدأ النموذج في الخطأ حيث يكلف كل خطأ الأعمال أموالاً. لذلك، الحديث عن البيانات هنا ليس أكاديمياً، بل هو حديث مباشر عن الإيرادات والتكاليف وجودة الخدمة.

تقدم المادة أيضاً حالات استخدام أقل وضوحاً. بالنسبة للشركة الصناعية، يمكن للذكاء الاصطناعي البحث عن إجابات في اللوائح الداخلية وتقليل عدد الأخطاء في العمليات الإنتاجية. للمهام المتعلقة برؤية الحاسوب — تحديد جودة الفولاذ حسب معاملات العملية والمساعدة في الحفاظ على نتائج مستقرة. في جميع الحالات، هناك نفس المنطق: في الأعلى توجد مقياس العمل، وتحتها — جودة تشغيل نظام التعلم الآلي، وتحتها تكمن مجموعة البيانات، التي إما تقوي النموذج أو تسحبه بشكل غير محسوس نحو الأسفل.

  • NPS ووقت الرد في الدعم
  • CTR والتحويل في التجارة الإلكترونية
  • دقة البحث في قاعدة المعرفة الداخلية
  • تقليل الأخطاء في العمليات الإنتاجية
  • جودة الاعتراف في أنظمة رؤية الحاسوب

عندما تكون مجموعة البيانات إلزامية

وفقاً لفايزييف، هناك حاجة إلى مجموعة بيانات عالية الجودة في حالتين نموذجيتين. الأولى — عندما تقارن الشركة الذكاء الاصطناعي بالعمل اليدوي وتريد أن تفهم ما إذا كان يمكن نشر الحل في الإنتاج. الثانية — عندما يكون النظام يعمل بالفعل، لكن مقاييسه لم تعد مرضية: الإجابات غير ذات صلة، التوصيات لا تؤدي إلى شراء، والسرعة أو الدقة وصلت إلى حد أقصى. في كلتا الحالتين، بدون جودة قابلة للقياس حالياً ومقياس هدف واضح، يصبح العمل مع البيانات تخميناً.

"هناك حاجة إلى مجموعات البيانات في مرحلتين من تطوير المنتج."

تم التركيز بشكل خاص على الاقتصاديات. مجموعة البيانات ليست تطويراً مخصصاً غير محدود، بل هي أداة نهائية يمكن تحضيرها والتحقق منها وتحميلها في خط الأنابيب للتدريب أو الضبط الدقيق. نعم، يجب تكرار تدقيقات النموذج بانتظام، لكن جمع البيانات والتصنيف عادة ما يكون من الأفضل الاستعانة بمصادر خارجية للمتخصصين في هذه العملية. إذا تم الاحتفاظ بكل شيء داخل الشركة، يقضي المهندسون أسابيع في اختيار الأمثلة وإعداد البيئة والتحكم في الجودة وإدارة المصنفين. بالنسبة للعمل، هذا غالباً ما يكون أكثر تكلفة مما يبدو في البداية.

لماذا يضعف التمويل الجماعي

المقابلة مثيرة للاهتمام أيضاً لأنها تلتقط تحولاً في السوق. كان التمويل الجماعي الضخم يعمل بشكل جيد في عصر المهام البسيطة مثل "قطة أو كلب". الآن يتم التعامل مع هذه السيناريوهات من قبل النماذج نفسها بثقة كافية، لذا يتحول التصنيف البشري إلى المجالات المتخصصة.

إذا كان يتعلق الأمر بمساعد أكواد للغة نادرة أو التحقق الصناعي المعقد أو قاعدة معرفة متخصصة، فأنت بحاجة ليس فقط إلى تدفق كبير من المنفذين، بل أشخاص يفهمون حقاً سياق المهمة ويمكنهم اكتشاف الأخطاء الدقيقة. لا يزال من الممكن اتباع نهج مختلط: يمكن إعطاء الجزء البسيط من خط الأنابيب للتصنيف الضخم، بينما الجزء المعقد — لفريق متخصص. لكن بعد ذلك يواجه العمل عبئاً جديداً: تحليل المهام، والبحث عن مقاولين مختلفين، ونقل السياق بينهم والتحكم الإضافي في الجودة عند الواجهات.

هذا هو بالضبط السبب في أن السوق، وفقاً لتقييم Doubletapp، تظل ضيقة نسبياً وتدور حول شركات LLM الكبيرة والمشاريع حيث يمكن تحويل تحسن المقاييس بسهولة إلى أموال.

ماذا يعني هذا

بالنسبة للسوق، هذا إشارة إلى أن الميزة التنافسية في الذكاء الاصطناعي تنتقل بشكل متزايد من اختيار النموذج الأعلى صراخاً إلى جودة البيانات المطبقة. لا تزال اللاعبون الكبار يحتاجون إلى مجموعات بيانات كبيرة، لكن الموجة التالية من الطلب قد تأتي من فرق صغيرة لديها منتجات ذكاء اصطناعي متخصصة. سوف يختبرون أولاً النموذج الأولي على البيانات الجاهزة، وعندما يرون الاقتصاديات، سيبدأون في شراء مجموعات بيانات موجهة لنقاط ضعفهم — وهناك حيث ستظهر النمو الحقيقي للمقاييس.

ZK
Hamidun News
أخبار الذكاء الاصطناعي بدون ضوضاء. اختيار تحريري يومي من أكثر من 400 مصدر. منتج من جمال حميدون، رئيس الذكاء الاصطناعي في Alpina Digital.

هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟

AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.

ما رأيك؟
جارٍ تحميل التعليقات…