كيف حوّل DeepSeek وWordstat جمع الكلمات المفتاحية يدوياً إلى نظام SEO متعدد الوكلاء
محاولة عادية للتوقف عن نسخ البيانات من Wordstat إلى Excel انتهت ببناء خط أنابيب SEO يضم DeepSeek وSERP Veto وensemble voting. أنشأ المؤلف نظاماً يعالج نحو…
معالج بواسطة الذكاء الاصطناعي من Habr AI؛ بتحرير Hamidun News
أظهر مؤلف على Habr كيف تحولت عملية نقل البيانات الروتينية من Wordstat إلى Excel إلى أداة SEO كاملة بها عدة وكلاء وتصويت النماذج وحكم منفصل. ونتيجة لذلك، تعالج النظام حوالي 3000 كلمة مفتاحية في 20–30 دقيقة، تاركة حوالي 5% فقط من الاستعلامات المتنازع عليها للمراجعة اليدوية.
كيف نما خط الأنابيب
في البداية، كانت المهمة مباشرة: التوقف عن نسخ الكلمات المفتاحية يدويًا. احتوت النسخة الأولى من البرنامج النصي ببساطة على سحب البيانات من Bukvarix وحفظها في ملف. ثم أدرك المؤلف أن هذا لم يكن كافيًا للحملات الإعلانية: يمكن أن تصبح تكرار البيانات في مثل هذه المصادر قديمة في غضون أشهر، مما يعني أن قرارات الميزانية تستند إلى بيانات قديمة.
لذلك أضاف النظام XMLRiver كمصدر بيانات أحدث من نظام Yandex البيئي، جنبًا إلى جنب معه—التكرار الأساسي والدقيق والمعتدل. لاحقًا، انتقل المشروع بعيدًا عن المعالجة البسيطة نحو المعالجة الدلالية الكاملة. من أجل التجميع، وصل المؤلف بـ SentenceTransformers، لكنه سرعان ما اصطدم بمشكلة نموذجية من NLP: الاستعلامات المتشابهة دلاليًا لا يجب أن تكون دائمًا على نفس الصفحة.
لتجنب الخلط، على سبيل المثال، الاستعلامات المعتمدة على الجغرافيا مثل الإصلاحات في موسكو وفورونيج، جاء فوق التضمينات SERP Veto—فحص تداخل URL في نتائج البحث. قبل ذلك، تم تنظيف القائمة من الحطام باستخدام regex وانهيار من خلال إلغاء التكرار الغامض، مما أزال 30–40% من النسخ المكررة قبل طلبات SERP المكلفة.
لماذا نموذج LLM واحد غير كافٍ
بمجرد أن تمكنت جدول البيانات بالفعل من جمع وتكرار وتجميع الكلمات المفتاحية، ظلت الجزء الأكثر كراهية: تصفية الحطام. هذا يعني الوظائف الشاغرة والمجمعات والاستعلامات ذات النية المعلوماتية والحالات الحدودية الأخرى التي يصعب إزالتها بكلمات سلبية بسيطة. حاول المؤلف إسناد المهمة إلى نموذج DeepSeek LLM واحد بموجه بسيط، لكنه اكتشف بسرعة أنه بدون السياق يخمن النموذج المكانة بحرية كبيرة جدًا.
قد تعني كلمة "إصلاح" بالنسبة له الشقق أو الهواتف أو محرك. لتقليل الفوضى، ظهر PlannerAgent قبل التصنيف. يتلقى وصفًا للمكان وينتج إرشادات للخطوة التالية: من هو العميل المستهدف، ما الأمثلة التي يجب اعتبارها ذات صلة، أي الفخاخ التي يجب قطعها، كيفية التعامل مع الجغرافيا.
بالموازاة مع ذلك، حسّن المؤلف التكلفة: بدلاً من إرجاع صفوف كاملة، بدأ النموذج في الرد فقط بمعرفات الكلمات المفتاحية. قلل هذا من حجم الاستجابة من حوالي 400 إلى 80 رمز لكل دفعة وأعطى توفيرات بنسبة 30–40% على التشغيل الكبير.
لماذا كان التصويت ضروريًا
حتى بعد هذه التحسينات، أظهرت نفس مجموعة 671 كلمة مفتاحية عبر ثلاث عمليات تشغيل فقط 37.7% من القرارات المستقرة تمامًا. كان السبب ليس في درجة الحرارة، بل في العملية نفسها: PlannerAgent غيّر بشكل طفيف أمثلة few-shot في كل مرة، وانتهت الاستعلامات الحدودية في فئات مختلفة. ثم أنشأ المؤلف Ensemble Voting: تعمل كل دفعة من 20 كلمة مفتاحية ثلاث مرات بالتوازي، ويتم تحديد النتيجة بأصوات الأغلبية. إذا اختلفت الإجابات الثلاث، يتم إرسال الاستعلام إلى قائمة "للمراجعة"، وفيما بعد يتم تحليله بواسطة وكيل تحكيم منفصل.
- زادت استقرار التصنيف من 37.7% إلى حوالي 85%
- تم تقليل المراجعة اليدوية إلى حوالي 5% من الاستعلامات
- يتم معالجة 3000 كلمة مفتاحية في 20–30 دقيقة بدلاً من 3–4 ساعات
- تبلغ تكلفة التشغيل مع ثلاثة أصوات حوالي 0.30 دولار
"أصلح ثلاث خطوط في الموجه. ثلاث خطوط. وقضيت أسبوعًا في بناء الهندسة
المعمارية قبل ذلك."
هذه العبارة تجسد خلاصة المؤلف الرئيسية بشكل جيد. بعد كل العمل المعماري، اتضح أن استعلام تجاري واضحًا انتهى باستمرار في فئة متنازع عليها ببساطة لأن قواعد الموجه لم تتضمن العبارة "جاهز للاستخدام". بمعنى آخر، لقد حسّن المخطط متعدد الوكلاء المعقد بالفعل الجودة، لكنه لم يلغ الحاجة الأساسية للتحقق من الموجه نفسه على الحالات الحدودية قبل تزيينه بالمجموعات والحكام.
ماذا يعني هذا
هذه الحالة مفيدة ليس فقط لمتخصصي SEO. يوضح كيف يمكن للأتمتة التطبيقية التي تحركها الآلام الحقيقية للمستخدم أن تنمو بسرعة في نظام الوكلاء إذا اصطدمت بحدود الجودة والتكلفة وعدم الاستقرار في الإنتاج. وفي الوقت نفسه، يذكرنا بحقيقة أكثر إزعاجًا: أحيانًا المكسب الرئيسي لا يأتي من وكيل جديد، بل من ثلاث خطوط مكتوبة بشكل جيد في الموجه.
هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟
AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.