Playwright و MCP: كيف يختبر وكيل الذكاء الاصطناعي واجهة المستخدم وقاعدة البيانات بدون تأكيدات SQL يدويّة
رسالة نجاح خضراء بعد الشراء لا تثبت أن الطلب تم إنشاؤه فعلاً. يقترح نمط التحقق الجديد full-stack تفويض جزأي السيناريو لوكيل ذكاء اصطناعي: التنقل عبر واجهة…
معالج بواسطة الذكاء الاصطناعي من Habr AI؛ بتحرير Hamidun News
أن يظهر إشعار أخضر بعد النقر على زر "إتمام الطلب" لا يعني بالضرورة أن الطلب قد تم إنشاؤه فعلاً. إذا تم التراجع عن المعاملة، أو فقدت قائمة الانتظار الرسالة، وظلت واجهة المستخدم تعرض "نجاح"، فإن الاختبار الشامل من طرف إلى طرف يعطي انطباعاً خاطئاً بالموثوقية. هذا هو السبب في أن عدداً متزايداً من الفرق يتجهون نحو التحقق الكامل من المكدس، حيث لا يتم التحقق من الواجهة فحسب، بل أيضاً من الحالة الفعلية للبيانات في قاعدة البيانات.
في النهج التقليدي، يتطلب هذا التحقق أن تتمتع البنية الأساسية للاختبار بإمكانية الوصول المباشر إلى قاعدة البيانات من خلال ORM أو برنامج تشغيل منخفض المستوى. ثم تبدأ النفقات العامة: بيانات اعتماد منفصلة، إعداد الاتصال، تأكيدات SQL يدوية، صيانة الاستعلامات مع كل تغيير في المخطط. من الناحية الشكلية يحل هذا المشكلة، لكن التكلفة تزداد مع عدد السيناريوهات.
يصبح كل اختبار شامل جديد من طرف إلى طرف ليس فقط فحصاً لسلوك المستخدم، بل مشروعاً صغيراً لصيانة كود الاختبار. تغطي المقالة نمطاً أخف وزناً: وكيل ذكاء اصطناعي واحد يعمل بشكل متسلسل مع خادمي MCP في نفس الوقت. أولاً، من خلال Playwright، يقوم بتنفيذ سيناريو في المتصفح كمستخدم عادي—يملأ السلة، يمر عبر الدفع، ينقر على زر التأكيد ويلتقط المؤشرات الرئيسية للنتيجة.
ثم ينتقل نفس الوكيل إلى خادم يمكنه قراءة هيكل قاعدة البيانات والإجابة على استعلامات التحقق دون أن يكتب المختبر SQL يدوياً. في الأساس، يحتاج الوكيل فقط إلى صياغة بالضبط ما يجب التحقق منه: هل سجل الطلب موجود، هل تطابق العناصر، هل تم خصم رصيد المنتج، هل تغير حالة الدفع. يغلق هذا النهج الفجوة الرئيسية بين "الواجهة أظهرت النجاح" و"اكتملت العملية التجارية فعلاً."
يمكن للوكيل مطابقة البيانات من الواجهة مع السجلات في الجداول، والتحقق من الآثار الجانبية، وحتى مراعاة عدم المزامنة إذا كانت النظام لا يكتب إلى قاعدة البيانات على الفور. بالنسبة لفرق المنتج، هذا مهم بشكل خاص في السيناريوهات حيث يؤدي زر مستخدم واحد إلى تشغيل سلسلة من الإجراءات: إنشاء الطلب، حجز المخزون، الكتابة إلى نظام الخدمات اللوجستية، تحديث حالة العميل. في مثل هذه الأماكن، تنشأ في أغلب الأحيان الأخطاء المكلفة، تلك التي لا تكتشفها الاختبارات العادية للواجهة.
القيمة العملية لهذا النمط تكمن في أنه يخفض حاجز الدخول لاختبار المكدس الكامل. لا تحتاج الفرق إلى سحب ORM إلى الاختبارات فقط لعدد قليل من الفحوصات وتكرار معرفة مخطط قاعدة البيانات في رمز التأكيد. بدلاً من ذلك، توجد طبقة تحقق واحدة على مستوى النية: "بعد الدفع يجب أن يظهر سجل الطلب،" "يجب أن يتطابق عدد العناصر،" "يجب أن ينخفض رصيد المستودع بمقدار واحد."
إذا تغير المخطط، تنتقل الصيانة إلى أقرب إلى خادم MCP أو إلى وصف الوصول إلى البيانات، بدلاً من أن تنتشر عبر عشرات الاختبارات. نتيجة لذلك، تصبح الاختبارات أقصر وأكثر وضوحاً وأقرب إلى لغة الأعمال. وفي الوقت نفسه، لا يلغي هذا السيناريو الانضباط الهندسي الأساسي.
لا يمكنك الاعتماد فقط على وكيل الذكاء الاصطناعي: اختبارات الوحدة واختبارات التكامل لا تزال مطلوبة لتحديد موقع الأخطاء بسرعة على مستوى الوظيفة والخدمة والعقد. يجب أن يكون الوصول إلى قاعدة البيانات للوكيل مقيداً، ويفضل أن يكون للقراءة فقط وفقط في بيئة الاختبار. تلزم أيضاً تدابير القابلية للتنبؤ: بيانات اختبار مستقرة، قواعد تحديد واضحة، حماية من أن يتحقق الوكيل بطريق الخطأ من الطلب الخاطئ في قاعدة بيانات مشتركة.
وإلا، تصبح الأداة الملائمة بسرعة مصدراً للأعطال الضوضائية والصعبة في الاستنساخ. الخلاصة الرئيسية هنا بسيطة: الخطوة التالية في تطور الاختبار الشامل من طرف إلى طرف هي الانتقال من التحقق من الشاشات إلى التحقق من العواقب الحقيقية لإجراء المستخدم. يجعل الجمع بين Playwright و MCP هذا الانتقال أرخص بشكل ملحوظ لأنه يزيل SQL اليدوي من العمل اليومي للمختبر ويسمح بأتمتة واحدة بقطع المسار من النقر على الزر إلى حقيقة سجل قاعدة البيانات.
بالنسبة للفرق التي تختبر المدفوعات والطلبات والحجوزات والمعاملات الحرجة الأخرى، هذا ليس مجرد تقنية مريحة بل طريقة لتقليل عدد الاختبارات الإيجابية الكاذبة والقبض على الأخطاء مبكراً قبل أن تتسرب إلى الإنتاج.
هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟
AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.