Anthropic تواصل تعقيد الاختبارات بسبب الغش باستخدام Claude
واجه فريق تحسين الأداء في Anthropic تحديًا غير معتاد: إذ أصبح نموذج Claude فعالًا أكثر من اللازم في حل الاختبارات المخصصة للمتقدمين للوظائف. ومنذ عام 2024،…
معالج بواسطة الذكاء الاصطناعي من TechCrunch؛ بتحرير Hamidun News
أنثروبيك تعقّد الاختبارات باستمرار بسبب الغش باستخدام كلود
في عصر التطور السريع للذكاء الاصطناعي، عندما تصبح نماذج اللغة القوية متاحة لنطاق واسع من المستخدمين، تواجه الطرق التقليدية لتقييم مؤهلات المتخصصين تحديات بلا سابقة. واجه فريق تحسين الأداء في شركة أنثروبيك الأمريكية، المعروفة بتطوير شبكة كلود العصبية المتقدمة، مشكلة غير عادية: إن إبداعها الخاص، أو بالأحرى أدوات الذكاء الاصطناعي المشابهة لها، بدأت "بالغش" في المقابلات الشخصية.
منذ بداية عام 2024، استخدمت أنثروبيك صيغة من مهام البرمجة في المنزل لاختبار المهارات التقنية للمرشحين لمناصب الهندسة. يهدف هذا النهج إلى إعطاء المتقدمين الفرصة لإظهار معارفهم وقدراتهم في بيئة أكثر هدوءاً وتأملاً مما هو ممكن خلال مقابلة معيارية. ومع ذلك، فإن تطوير أدوات الذكاء الاصطناعي لكتابة الأكواد البرمجية، مثل جيت هاب كوبايلوت، بالإضافة إلى تحسينات نماذج اللغة الكبيرة نفسها، أدى إلى حل هذه المهام بسهولة كبيرة بمساعدتها. أوجد هذا وضعاً أصبح فيه التقييم الموضوعي لمؤهلات المرشح صعباً، لأنه كان من المستحيل القول بثقة ما إذا كان المتقدم نفسه قد حل المهمة أم أن الذكاء الاصطناعي هو من قام بذلك.
لمواجهة هذا الاتجاه ومنع الاحتيال، يتعين على مهندسي أنثروبيك مراجعة وتعقيد مهام الاختبار باستمرار. تتمثل المهمة في إنشاء مشاكل تتطلب فهماً سياقياً عميقاً وطرقاً غير تقليدية وإبداعاً—المجالات التي تتخلف فيها نماذج الذكاء الاصطناعي الحديثة، على الرغم من قدراتها المثيرة للإعجاب، لا تزال عن البشر. تتعلق الأمر بمهام لا تتطلب ببساطة إعادة إنتاج خوارزميات معروفة أو كتابة أكواد نموذجية، بل بمشاكل يكون من الضروري فيها تحليل الأنظمة المعقدة واتخاذ القرارات في ظل عدم اليقين ودمج المعارف المتفرقة وإظهار التفكير الأصلي. هذه المهام أصعب في الأتمتة وأصعب في "تزويد" نموذج اللغة للحصول على حل جاهز.
يسلط هذا الوضع الضوء على التعقيد المتزايد لتقييم المهارات البشرية في عصر التوفر الواسع لأدوات الذكاء الاصطناعي القوية. أصبح الخط الفاصل بين الكفاءة البشرية والقدرات الذكاء الاصطناعي ضبابياً بشكل متزايد. بدأت الشركات في جميع أنحاء العالم تفكر في مناهج جديدة للتوظيف وتقييم الموظفين قد تأخذ في الحسبان واقع المشهد التكنولوجي الحالي. ربما يكمن المستقبل في تقييم ليس فقط النتيجة النهائية بل أيضاً عملية حل المشكلة ذاتها، في تحليل عملية التفكير، في اختبار القدرة على التكيف والتعلم. أنثروبيك، وهي تواجه هذا التحدي في الطليعة، تظهر فعلياً كيف يُضطر القطاع إلى التكيف مع ظروف متغيرة حيث يصبح الذكاء الاصطناعي ليس فقط أداة للعمل بل عاملاً يغير قواعد اللعبة في عملية التوظيف.
في الختام، إن الزيادة المستمرة في تعقيد مهام الاختبار في أنثروبيك هي مثال صارخ على كيفية أن التقدم التكنولوجي يتطلب مرونة وابتكاراً في جميع مجالات النشاط البشري، بما فيها عملية اختيار الموظفين. يفرض هذا علينا إعادة النظر في مفهوم الكفاءة المهنية ذاته والبحث عن طرق تقييم جديدة وأكثر موثوقية يمكنها أن تمييز المواهب البشرية الحقيقية من الإجابات التي يتم إنشاؤها ببراعة من قبل الذكاء الاصطناعي. يتطلب العصر الذي يصبح فيه الذكاء الاصطناعي مساعداً عاماً مناهج جديدة لتقييم ما يعنيه حقاً أن تكون متخصصاً مختصاً.
هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟
AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.