TNW→ المصدر

OpenAI و Anthropic و Google يخافون من سؤال واحد من المديرين التقنيين

يأمل موردو أدوات الذكاء الاصطناعي—OpenAI و Anthropic و Google وعشرات الشركات الناشئة—ألا يتم طرح سؤال واحد أبداً: 'ما هي النتائج الفعلية؟' تبني الذكاء…

معالج بواسطة الذكاء الاصطناعي من TNW؛ بتحرير Hamidun News
OpenAI و Anthropic و Google يخافون من سؤال واحد من المديرين التقنيين
المصدر: TNW. كولاج: Hamidun News.
◐ استمع للمقال

يتشارك موفرو أدوات الذكاء الاصطناعي للمطورين — من OpenAI و Anthropic إلى Google وعشرات شركات الناشئة في مجال الذكاء الاصطناعي التي تبني وكلاء لكتابة الأكواد — اهتماماً مشتركاً في ضمان عدم قيام نائب الرئيس للهندسة بطرح سؤال محدد واحد. ليس "كم عدد الموظفين الذين يستخدمون الأداة؟" وليس "كم نما حجم الأكوال المُنتجة؟". خوفهم الحقيقي هو السؤال: "ما هي النتائج التجارية الفعلية؟" إن اعتماد الذكاء الاصطناعي في تطوير البرمجيات متفجر بالفعل.

يبلغ GitHub Copilot عن ملايين المستخدمين النشطين. يستحوذ Cursor و Replit و Windsurf والعشرات من الأدوات الأقل شهرة على ميزانيات فرق التكنولوجيا في جميع أنحاء العالم. وفقاً لأبحاث الصناعة، يستخدم أكثر من 70% من المطورين في الشركات الكبيرة بالفعل أداة ذكاء اصطناعي واحدة على الأقل لكتابة الأكواد.

سيتجاوز السوق بأكمله لمساعدات الذكاء الاصطناعي للمطورين، وفقاً لتقدير المحللين، 10 مليارات دولار بحلول عام 2027. لكن تحت هذه الأرقام المثيرة للإعجاب تختبئ مشكلة خطيرة. يقيس معظم قادة الهندسة مقاييس الاستخدام، وليس النتائج.

إنهم يعرفون عدد المطورين الذين قاموا بتفعيل الترخيص، وعدد سطور الأكوال التي اقترحها الذكاء الاصطناعي وتمت الموافقة عليها، ونسبة الفريق التي "تستخدم بنشاط" المنتج. لكنهم لا يتابعون ما إذا كان وقت إطلاق الميزات قد انخفض، أو ما إذا انخفضت الأخطاء في الإنتاج، أو ما إذا تم تقليل الدين الفني، أو ما إذا زادت سرعة التطوير الفعلية بعد تطبيق الذكاء الاصطناعي. هذه نقطة عمياء مكلفة تناسب موفري الأدوات تماماً.

والسبب في هذه الفجوة واضح: قياس الاستخدام سهل، بينما قياس النتائج الفعلية صعب للغاية. لتقييم التأثير الحقيقي للذكاء الاصطناعي على إنتاجية الفريق، تحتاج إلى بيانات أساسية من قبل التطبيق، ومجموعات تحكم مناسبة، وتعريفات قوية لما يعنيه "الإنتاجية" (وهي بحد ذاتها موضوع نقاش حاد في مجتمع الهندسة)، والوقت — بحد أدنى عدة أرباع سنة. يهتم موفرو الأدوات بتجديد الترخيصات والقصص التسويقية المقنعة للنجاح، وليس بالأبحاث الصارمة التي قد تكشف عن تأثيرات متواضعة أو حتى سلبية في سيناريوهات مختلفة.

عدد قليل من الدراسات المستقلة حول هذا الموضوع تعطي نتائج مختلطة. أظهرت تجارب GitHub زيادة في الإنتاجية بنسبة 55% للمهام المحددة مثل كتابة خادم HTTP من الصفر. أظهرت أبحاث أخرى — بما في ذلك من METR والمختبرات المستقلة — مكاسب أكثر تواضعاً بكثير أو حذرت من أن الزيادة في سرعة كتابة الأكوال غالباً ما يتم تعويضها بوقت متزايد يقضي في مراجعة وتصحيح الأكوال التي ينتجها الذكاء الاصطناعي.

الواقع يعتمد بشكل كبير على نوع المهمة ومستوى خبرة الفريق وكيفية بناء عملية استخدام الأدوات. مسألة منفصلة هي الجيل الجديد من وكلاء الذكاء الاصطناعي. بينما كانت الأدوات المبكرة مثل Copilot تعمل كإكمال تلقائي متقدم، يدّعي وكلاء 2025-2026 بإنجاز مهام كاملة بشكل مستقل: من كتابة الأكوال إلى إنشاء PRs واجتياز جزء من CI/CD.

هذا يرفع المخاطر: إذا لم تتمكن من قياس العائد على الاستثمار من مساعد ذكاء اصطناعي أساسي، كيف ستقيم نتائج وكيل شبه مستقل؟ الاستنتاج الرئيسي بسيط لكنه محرج للسوق: يجب على قادة الهندسة أن يتوقفوا عن قياس الاستخدام وأن يبدأوا بتصميم تجارب حقيقية مع نتائج قابلة للقياس قبل التوقيع على عقود بستة أرقام لأدوات الذكاء الاصطناعي. حدد المقاييس مسبقاً — وقت الدورة، معدل الأخطاء، وقت مراجعة PR، الوقت المستغرق لإدماج المطورين الجدد. قارن الفرق التي لديها الأداة مع تلك التي لا تملكها، بدلاً من مجرد تتبع "الرضا" العام.

موفرو الأدوات لن يعلموك هذا — ليس لديهم حافز للقيام بذلك. لكن القدرة على طرح سؤال محرج هو ما يفصل قادة الهندسة الذين يحسنون حقاً عمل فريقهم عن أولئك الذين يشترون ببساطة وهم التقدم.

ZK
Hamidun News
أخبار الذكاء الاصطناعي بدون ضوضاء. اختيار تحريري يومي من أكثر من 400 مصدر. منتج من جمال حميدون، رئيس الذكاء الاصطناعي في Alpina Digital.

هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟

AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.

ما رأيك؟
جارٍ تحميل التعليقات…