Claude Code و11 وكيل: كيف أتمتة فريق QA حتى 80% من روتين الاختبار
بدلاً من توظيف مختبري إضافيين، قام فريق QA ببناء نظام من 11 وكيل يعتمد على Claude Code. يقوم النظام بتحليل Jira و Confluence، وبناء سيناريوهات اختبار وفقاً…
معالج بواسطة الذكاء الاصطناعي من Habr AI؛ بتحرير Hamidun News
أثبت فريق التحكم بالجودة أن وكلاء الذكاء الاصطناعي يمكنهم بالفعل تولي معظم العمل الروتيني للاختبار: من قراءة المتطلبات وتصميم سيناريوهات الاختبار إلى تحميل حالات الاختبار في نظام إدارة الاختبارات وإنشاء طلبات الدمج مع الاختبارات الآلية الجاهزة. بدلاً من توسيع فريقهم بمختبرين إضافيين اثنين، قام الفريق بناء "هيكل خارجي" من 11 وكيل متخصص بناءً على Claude Code ويؤكد أنه يغطي حتى 80% من العمل التشغيلي لمهندس التحكم بالجودة. انطلقوا من مشكلة نموذجية في فرق المنتجات: يُطلق التطوير ميزات جديدة أسرع مما يستطيع الاختبار تحويل المتطلبات إلى سيناريوهات وبيانات واختبارات آلية.
وفقاً للتقييم الداخلي، يذهب حوالي 20% من وقت التحكم بالجودة إلى تحليل المتطلبات وتصميم الاختبارات، و15% آخر إلى إنشاء حالات في نظام إدارة الاختبارات، و10% إلى إعداد البيانات، و25% إلى الاختبارات الآلية، ثم تأتي التحققات نفسها والاختبارات الانحدارية والتقارير. في المجموع، يمكن وصف ما يصل إلى 80% من حمل العمل بالقواعد وتقسيمها إلى مراحل قابلة للتكرار. ومن هنا جاءت الفكرة: عدم استبدال المهندس، بل تحويله إلى مشغل خط أنابيب يحدد المهمة ويتحكم في القطع الأثرية ويتدخل فقط حيث يفتقر النظام إلى السياق أو يحتاج إلى اتخاذ قرار غامض.
تم بناء العمارة كسلسلة معيارية من 11 مهارة وموصل منفصل. يستخرج وكيل واحد المهمة من Jira والمواد ذات الصلة من Confluence، وينقسم وكيل آخر المتطلبات إلى قصص المستخدم والمهام، ويولد الثالث سيناريوهات اختبار وفقاً لقواعد ISTQB، والمتتالية تتعامل مع البيانات المفقودة والاختلافات ومحددات DOM والاختبارات الآلية للواجهات البرمجية والواجهات الرسومية، مقارنة السيناريوهات مع الكود، وتحميل الحالات إلى Zephyr Scale وإنشاء طلبات دمج في GitLab. تعمل سيناريوهات JSON بقابلية التتبع الكاملة للمتطلبات ومعايير القبول كمصدر حقيقي واحد، بينما يتم بناء مصفوفة تغطية RTM بالتوازي.
بالنسبة لجزء الواجهة الأمامية، يقوم النظام أيضاً بالوصول إلى Figma من خلال MCP ويستخرج ليس فقط لقطات الشاشة، بل بنية الواجهة وحالات العناصر والقيود. تم وضع تركيز خاص على الجودة والحماية من نقاط ضعف LLM النموذجية. بعد توليد السيناريوهات، يقوم الموصل بتشغيل نقاط فحص الجودة: التحقق من مخطط JSON واكتمال الخطوات والأولويات وعدم وجود نسخ مكررة والتغطية المطلوبة.
بعد توليد الاختبارات الآلية، يصبح التحكم أكثر صرامة: يتم التحقق من صحة كود Python والدعائم والتشغيل الفعلي للاختبارات. يتم استخدام مخطط تصحيح أخطاء على مرحلتين. أولاً، يقوم النظام بتشغيل كل اختبار بشكل منفصل وتمييز مشاكل كود الاختبار عن الأخطاء الفعلية في المنتج.
بعد ذلك، يبدأ اختبار الطفرات: على اختبار نجح بالفعل، يتم قلب التأكيد، وإذا ظل أخضر على أي حال، فإن هذا الاختبار يعتبر فارغاً ويتطلب تحسين. طبقة أخرى مهمة هي بروتوكول الاختلافات بين Jira وFigma ونص المتطلبات والسلوك الفعلي للواجهة. يتم حل الاختلافات الواضحة تلقائياً بموجب تسلسل الأولويات للمصادر، بينما يتم تصعيد الحالات المتنازع عليها إلى المهندس.
في الواقع، قدم المشروع التجريبي على مدى ستة أسابيع ونصف أرقاماً تبرر عادة إطلاق هذه التجارب. ارتفع عدد حالات اختبار الانحدار من حوالي 50 إلى 400 تقريباً، وأصبح تفصيل السيناريوهات كاملاً، واقتربت تغطية الانحدار بالاختبارات الآلية من 100%. تم تقليل وقت الانحدار نفسه من حوالي يوم واحد إلى عشرات الدقائق، والمسار من انتهاء التطوير إلى موافقة التحكم بالجودة من عدة أيام إلى عدة ساعات، وأصبح إعداد الاختبارات لمشروع جديد يستغرق حوالي أربع ساعات من الإعداد بدلاً من أشهر للتوظيف والتكيف.
بالإضافة إلى ذلك، بدأ النظام في العثور على المزيد من تناقضات المتطلبات المخفية والأخطاء من العملية اليدوية. في غضون ذلك، تعمل نسخة المشروع التجريبي على اشتراك Claude Pro مقابل 100 دولار شهرياً ويزعم أنها قادرة على خدمة 2-3 مشاريع يحتوي كل منها على أكثر من 100 اختبار شهرياً. الخلاصة الرئيسية من هذه الحالة هي أن دور التحكم بالجودة يبدأ بالفعل بالانتقال من التنفيذ اليدوي إلى إدارة السياق والقواعد وجودة القرارات التي تتخذها الذكاء الاصطناعي.
لكن القصة تعمل فقط تحت عدة شروط: يجب أن تكون المتطلبات كاملة بشكل كافٍ، ويجب أن يكون لدى المشروع مصدر مناسب للسياق مثل عقود الواجهات البرمجية وبيانات الاختبار، والخط الأنابيب نفسه يجب ألا يكون "صندوقاً أسود". القيمة هنا ليست في توليد الاختبارات السحري، بل في سلسلة شفافة من الخطوات التي يمكن إعادة تشغيلها والتحقق منها وتقويتها تدريجياً. إذا انطلقت هذه النهج خارج المشاريع التجريبية، فقد يحصل سوق الاختبارات على ليس استبدالاً للمهندسين، بل صيغة أكثر إنتاجية وقابلية للتوسع لعملهم.
هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟
AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.