Jiqizhixin (机器之心)→ المصدر

ProjDevBench: هل يستطيع الذكاء الاصطناعي إنشاء برمجيات كاملة من الصفر؟

# ProjDevBench: هل يمكن للذكاء الاصطناعي إنشاء برنامج متكامل من الصفر؟ عندما نناقش الذكاء الاصطناعي في تطوير البرمجيات، نتذكر عادة أمثلة مثل ChatGPT الذي…

معالج بواسطة الذكاء الاصطناعي من Jiqizhixin (机器之心)؛ بتحرير Hamidun News
ProjDevBench: هل يستطيع الذكاء الاصطناعي إنشاء برمجيات كاملة من الصفر؟
المصدر: Jiqizhixin (机器之心). كولاج: Hamidun News.
◐ استمع للمقال

# ProjDevBench: هل يمكن للذكاء الاصطناعي إنشاء برنامج متكامل من الصفر؟

عندما نناقش الذكاء الاصطناعي في تطوير البرمجيات، نتذكر عادة أمثلة مثل ChatGPT الذي يصحح خللاً في دالة في دقائق، أو Claude الذي ينشئ كوداً أنيقاً لخوارزمية بسيطة. لكن ماذا سيحدث إذا طلبنا من وكيل ذكاء اصطناعي تصميم وبناء تطبيق متكامل من الصفر—مع كامل البنية المعمارية وإدارة التبعيات والتكامل بين المكونات؟ عمل الباحثون من المختبرات الرائدة بهدوء على هذا السؤال وأنشأوا ProjDevBench، وهي منصة تكشف عن القدرات الحقيقية والقيود الفعلية للنماذج الحالية للذكاء الاصطناعي التي تعمل كمهندسي برمجيات متخصصين بالكامل. تفرض النتائج إعادة النظر في التنبؤات المتفائلة حول الاستبدال الوشيك للمطورين بالأتمتة.

يختلف ProjDevBench بشكل أساسي عن جميع اختبارات الترميز الذكي السابقة. بينما كانت الأبحاث السابقة تتحقق مما إذا كان النموذج يمكنه كتابة دالة واحدة أو حل مشكلة LeetCode، يقدم معيار جديد للذكاء الاصطناعي مهمة حقيقية: إنشاء منتج مكتمل من الصفر. تطلب المنصة من الوكلاء ليس فقط توليد الكود بل اتخاذ قرارات معمارية، وتقسيم المشروع إلى وحدات، وإدارة التبعيات، وكتابة الاختبارات، وتكامل كل شيء في منتج يعمل. هذه ليست دوال معزولة—هذه محاكاة للتطوير الحقيقي، حيث تؤثر كل قرار على التالي، وتتراكم الأخطاء، مما يعقد النظام بأكمله.

تعكس بنية ProjDevBench نفسها التحديات الحقيقية في هندسة البرمجيات. يتم إعطاء الوكلاء مواصفات لمشاريع بدرجات تعقيد متفاوتة: من الأدوات البسيطة إلى التطبيقات ذات الطبقات المتعددة من المنطق وقواعد البيانات وواجهات برمجية خارجية. يجب أن تفهم النماذج المتطلبات وتخطط بنية الكود واختيار التقنيات والمكتبات المناسبة وإدارة التعارضات بين المكونات وضمان الوظائف. هذا مشابه جداً لما يفعله مطور بدء حياته المهنية في مهمته الأولى الجدية، باستثناء عدم القدرة على طلب النصيحة من زملاء أكثر خبرة أو الحصول على مراجعة طلبات السحب.

فتحت نتائج الاختبارات عيون حتى المتفائلين. وكلاء LLM الحديثون، المدعومون بنماذج رائدة مثل GPT-4 و Claude، يظهرون بالفعل تقدماً مقارنة بالأجيال السابقة. يمكنهم تقسيم مشروع بكفاءة إلى وحدات واختيار بنية معمارية قوية وكتابة كود وظيفي. لكن المشاكل تظهر على الفور. ينسى الوكلاء التبعيات بين المكونات ويولدون كوداً يعمل بمعزل عن الآخرين لكنه ينكسر أثناء التكامل. إنهم يديرون حالة النظام بشكل سيء وغالباً لا يمكنهم تتبع كيفية تأثير التغييرات في وحدة واحدة على الوحدات الأخرى. تنخفض قابلية توسع الكود مع زيادة التعقيد—يبدأ الوكلاء في تكرار المنطق بدلاً من إعادة الهيكلة، مما يحول مشروعاً بسيطاً إلى فوضى معقدة.

علاوة على ذلك، يؤدي مطورو الذكاء الاصطناعي أداءً سيئاً في تصحيح الأخطاء على مستوى المشروع. عندما يحدث خطأ ما، تفقد النماذج غالباً نهاية العلاقات السببية وتبدأ في تغيير أجزاء عشوائية من الكود بدلاً من تحليل المشكلة منطقياً. غالباً ما تصبح الاختبارات، التي يجب أن تكون جزءاً لا يتجزأ من التطوير، شكلية—يكتب الوكلاء اختبارات تجتاز لأنهم يختبرون بشكل أساسي نفس الشيء مثل الكود الفعلي.

هذه النتائج لا تعني أن الذكاء الاصطناعي عديم الفائدة للتطوير. إنها تكشف عن فجوة حقيقية بين توليد الكود وهندسة البرمجيات. الأول هو الحسابات؛ الثاني هو فن. يؤكد ProjDevBench أن الطريق نحو مطورين ذكاء اصطناعي متطورين بالكامل لا يزال طويلاً. المستقبل يخص على الأرجح الأدوات الهجينة: مساعدو الذكاء الاصطناعي الذين ينشئون الكود ويقترحون الحلول، لكن تحت إشراف مهندس متمرس مستعد للتفكير بشكل استراتيجي ورؤية الصورة الكاملة.

ZK
Hamidun News
أخبار الذكاء الاصطناعي بدون ضوضاء. اختيار تحريري يومي من أكثر من 400 مصدر. منتج من جمال حميدون، رئيس الذكاء الاصطناعي في Alpina Digital.

هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟

AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.

ما رأيك؟
جارٍ تحميل التعليقات…