ZDNet: أظهرت BlueOptima أن AI للكود في الإنتاج أضعف بكثير مما وُعد به
يُسوَّق AI باعتباره طريقًا سريعًا إلى رفع الكفاءة، لكن الصورة في بيئة الإنتاج أكثر قسوة. وأظهرت دراسة BlueOptima التي يستند إليها ZDNet أن أفضل نماذج إعادة…
معالج بواسطة الذكاء الاصطناعي من ZDNet AI؛ بتحرير Hamidun News
يُباع الذكاء الاصطناعي غالبًا كزر للكفاءة الفورية، بدلاً من كونه مشروعًا هندسيًا معقدًا. يسلط ZDNet الضوء على بحث BlueOptima وتحذيرات محلل ديفيد لينتيكوم: بدون تحضير مناسب وقياس وخبرة، قد يؤدي التطبيق إلى نتائج مختلفة جدًا عما يُعد به في العروض التقديمية.
الاختبار في الإنتاج
الحجة الرئيسية ضد الضجة حول الذكاء الاصطناعي في المقالة عملية جدًا: تحتاج إلى النظر ليس إلى العروض التوضيحية والمعايير، بل إلى العمل الفعلي في الإنتاج. أجرت دراسة BlueOptima BARE 57 نموذج لغة كبير من خلال مهام إعادة الهيكلة المتعلقة بسهولة صيانة الكود. استخدمت الاختبارات 4,276 ملف فعلي بتسع لغات—من C و C++ إلى Python و PHP و TypeScript. في المجموع، كان هناك 243,732 زوج نموذج-ملف. بهذه المادة، حتى أفضل نماذج الذكاء الاصطناعي أظهرت نجاحًا في أقل من 23% من الحالات.
الفجوة بين الأرقام الرائعة من المختبر والتطبيق الفعلي مؤلمة أكثر. على المعايير الشهيرة، حققت العديد من النماذج أكثر من 85%، لكن في المهام التي تتطلب تحسين سهولة صيانة كود الإنتاج، كان المتوسط حول 17%. تم قياس النجاح بصرامة: كان يجب أن يترجم الكود، ويعمل بشكل صحيح، ولا يكسر السلوك الأصلي، ويحسن فعلاً سهولة الصيانة وليس فقط يبدو أنظف. الفرق بين اللغات أيضًا مهم: حوالي 32% نجاح في JavaScript مقابل حوالي 4% في C، وفي المهام المعمارية المعقدة، انخفضت النسبة إلى 1.5%.
من أين تأتي الضجة
وفقًا لـ ZDNet، المشكلة ليست أن الذكاء الاصطناعي عديم الفائدة. المشكلة هي أنه يُباع غالبًا كحل جاهز، مما يخفي حجم العمل خلف الكواليس. لكي يقدم النموذج قيمة حقيقية، تحتاج إلى التكاملات وتنظيف البيانات وعملية المراجعة والتحكم في الانحدار والأمان والقابلية للرصد والأشخاص الذين يفهمون حدود الأداة. بدون ذلك، تحصل الشركة ليس على تسريع بل على تجربة مكلفة تبدو مقنعة فقط على الشرائح الموجهة للإدارة.
إذا بدت التكنولوجيا جيدة جدًا لتكون صحيحة، فربما تكون كذلك.
يضيف ديفيد لينتيكوم طبقة أخرى للمشكلة: السوق يكافئ ليس الأكثر كفاءة بل الأكثر ثقة. أصبح الذكاء الاصطناعي تسمية مريحة لأي شيء "ذكي" و"حديث"، لذا فإن طبقة من المستشارين والمبشرين والمديرين الذين تعلموا المفردات لكنهم لا يفهمون كيف يعمل كل شيء في السياق التجاري تنمو بسرعة حول الموضوع. نتيجة لذلك، يمكن أن تستند قرارات الاستثمار والإستراتيجية إلى خبرة سطحية. يحذر لينتيكوم من أن هذه الأنظمة تكلف أحيانًا 10–20 مرة أكثر من البدائل التقليدية، والأخطاء في الاتجاه الإستراتيجي تتحول بسهولة إلى نفقات غير ضرورية وأخطاء إستراتيجية.
كيفية المقاومة
مقاومة الضجة لا تعني رفض الذكاء الاصطناعي. هذا يعني التوقف عن شراء وعد "السحر" والبدء في إدارة التكنولوجيا كنظام معقد عادي. يجب أن يبدأ التقييم من مهمة محددة وليس من تسمية موضة. إذا كان يمكن حل الهدف من خلال الأتمتة العادية أو القواعد أو تحسين العملية، فهذا أيضًا نتيجة صحيحة. الذكاء الاصطناعي منطقي حيث يمكن قياس مزاياه في سيناريوهات فعلية وليس التخمين من عرض تقديمي للمورد.
- أولاً، حدد مهمة العمل والمقياس الأساسي قبل التنفيذ.
- اختبر النماذج على بيانات وكود وسير عمل خاصة بك وليس على عروض المورد التوضيحية.
- احسب التكلفة الكاملة: الترخيص والبنية التحتية والمراجعة والأمان والدعم.
- عيّن المسؤولية للأشخاص الذين يفهمون نقاط القوة وحدود الذكاء الاصطناعي على حد سواء.
يعتدل هذا النهج التوقعات. لا ينفي الحالات المفيدة—يمكن للذكاء الاصطناعي تسريع العمل الخشن والمساعدة في البحث واقتراح خيارات إعادة الهيكلة وتوفير وقت الفريق. لكن حيث تنطوي العمارة المعقدة والتغييرات الحرجة أو الحلول المستقلة بدون مراجعة بشرية، فإن تكلفة الخطأ لا تزال مرتفعة جدًا. لهذا السبب تنظر الفرق الناضجة ليس إلى قوة الوعود بل إلى النتائج القابلة للتكرار ولا تخلط بين اقتراح محظوظ ومنتج ناضج.
ما يعنيه هذا
حاليًا، يخيب الذكاء الاصطناعي الآمال في أغلب الأحيان ليس لأنه يفتقر إلى الإمكانيات بل لأن السوق يبيعه أسرع مما تستطيع الشركات فهم الحدود الفعلية للتكنولوجيا. من سيقيس التأثير في الإنتاج ويصفي الضوضاء ويشتري ليس الضجة بل الخبرة الصحيحة سيفوز.
هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟
AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.