اختبرت Anthropic سوقًا حيث تتفاوض وكلاء الذكاء الاصطناعي وتُبرم الصفقات بأنفسهم
أجرت Anthropic تجربة Project Deal: أوكل 69 موظفًا إلى وكلاء الذكاء الاصطناعي شراء وبيع العناصر، التي تفاوضت مع بعضها البعض على Slack دون تدخل بشري. في أسبوع…
معالج بواسطة الذكاء الاصطناعي من TechCrunch؛ بتحرير Hamidun News
اختبرت Anthropic سوقًا حيث تتاجر وكلاء الذكاء الاصطناعي مع بعضها البعض وتُبرم الصفقات دون مشاركة إنسانية في كل خطوة، وهذا لم يعد يبدو وكأنه خيال علمي. في تجربة Project Deal، أنشأت الشركة سوقًا داخليًا حيث مثّل Claude كل من البائعين والمشترين، ونشر الكثير بنفسه، وأجرى مفاوضات، وقدم عروضًا مضادة، وأتمّ الصفقات. من المهم ملاحظة أن هذا لم يكن محاكاة على بيانات اختبار: تبادل الموظفون فعليًا أشياء حقيقية وأموالًا بعد انتهاء التجربة.
شملت التجربة 69 موظفًا من Anthropic في مكتب سان فرانسيسكو. تلقى كل منهم ميزانية مشروطة بقيمة 100 دولار، والتي تمت معاوضتها لاحقًا ببطاقات هدايا بناءً على عمليات الشراء والبيع الخاصة بهم. قبل البدء، كان Claude يُجري مقابلة قصيرة: يكتشف ما كان الشخص مستعدًا لبيعه، وما أراد شراءه، بأي سعر، وكيف بالضبط يجب أن يُجري الوكيل المفاوضات.
بعد ذلك، تم إنشاء وكيل منفصل بتعليمات نظام فردية لكل مشارك. تمت المفاوضات داخل قنوات Slack، ولم يؤكد الأشخاص كل صفقة يدويًا: بمجرد البدء، تصرف الوكلاء بشكل مستقل. أطلقت Anthropic في آن واحد أربع نسخ من السوق.
كانت إحداها تُعتبر "حقيقية" — بناءً على نتائجها، تبادل المشاركون السلع لاحقًا؛ كانت الثلاث الأخرى ضرورية للمقارنة. في نسختين، مثّل جميع الأشخاص Claude Opus 4.5، بينما في نسختين أخريين، تم تقسيم المشاركين عشوائيًا بين Opus 4.
5 والنموذج الأخف Haiku 4.5. في النسخة "الحقيقية"، أبرم الوكلاء 186 صفقة على أكثر من 500 قائمة بقيمة تزيد قليلاً عن 4000 دولار.
لم تكن هذه عمليات شراء فورية بنقرة واحدة: كان على الوكلاء البحث عن تطابق الاهتمامات، والتنازع حول الأسعار، والرد على العروض المضادة، وإحضار المحادثة إلى اتفاق. اتضح أن الاستنتاج الرئيسي لم يكن أن الذكاء الاصطناعي نجح بشكل عام، بل أن جودة النموذج أثرت بشكل مباشر على النتيجة. وفقًا لـ Anthropic، أبرم المستخدمون مع Opus في المتوسط حوالي صفقتين إضافيتين مقارنة بمستخدمي Haiku.
عندما كان يبيع نفس العنصر بواسطة Opus، كان السعر في المتوسط أعلى بـ 3.64 دولارًا، وفي التقييم الإجمالي، حقق Opus كبائع حوالي 2.68 دولارًا إضافيًا، بينما كمشترٍ، على العكس من ذلك، خفّض السعر بحوالي 2.
45 دولارًا. في الأمثلة الفردية، كان الفرق أكثر وضوحًا: بيع وكيل Opus لنفس الياقوت المزروع بالمختبر مقابل 65 دولارًا، بينما باع Haiku مقابل 35 دولارًا فقط؛ ذهبت دراجة جبلية قابلة للطي مكسورة بـ 65 دولارًا في نسخة واحدة مقابل 38 دولارًا في أخرى. بشكل مثير للاهتمام، لم يغير أسلوب التعليمات النتيجة بشكل يذكر.
طلب بعض الموظفين من وكلائهم أن يكونوا لطيفين وودودين، بينما طلب آخرون أن يتفاوضوا بشدة وأن يبدأوا بعروض منخفضة. لم يُلاحظ تأثير ذو دلالة إحصائية: لم تزد الأوامر العدوانية من احتمالية البيع ولم تساعد بشكل ثابت على الحصول على سعر أفضل. ومع ذلك، ظهرت خصائص أخرى للتجارة الوكيلة.
اشترى أحد الوكلاء لشخص ما لوحة تزلج على الثلج متطابقة تقريبًا مع اللوحة التي كانت لديه بالفعل، على ما يبدو أنه فسّر أذواق المالك بحرفية مفرطة. اختار آخر، بناءً على طلب موظفة، هدية "لـ Claude نفسه" — صندوق يحتوي على 19 كرة ping-pong مقابل 3 دولارات. كانت هناك أيضًا صفقات لا تتعلق بالأشياء بل بالتجارب: على سبيل المثال، اتفق الوكلاء على "لقاء الكلاب" المجاني في اليوم.
كانت الملاحظة الأكثر استياءً لـ Anthropic مختلفة: الأشخاص الذين مثّلهم النموذج الأضعف لم يلاحظوا تقريبًا أنهم يتلقون شروطًا أسوأ. في الاستبيانات، قيّم المشاركون العدالة في الصفقات بشكل متقارب تقريبًا، على الرغم من أن الفرق في الأسعار والنتائج كان موجودًا بالفعل. إذا تحول هذا من تجربة مكتبية إلى تجارة حقيقية، ينشأ خطر جديد: قد تنشأ عدم المساواة بين المستخدمين ليس من مهاراتهم، بل من جودة الوكيل المستأجر، والطرف الخاسر لن يدرك حتى أنه يتم التغلب عليه بشكل منهجي.
لذلك، يبدو Project Deal ليس مجرد عرض توضيحي مرح لـ Claude، بل كتحذير مبكر حول كيفية تنظيم السوق عندما يبدأ الذكاء الاصطناعي بالتجارة بدلاً من الناس.
هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟
AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.