TNW→ المصدر

أطلقت Anthropic Claude Opus 4.7 مع أفضل النتائج في البرمجة ومهام الوكلاء

أطلقت Anthropic Claude Opus 4.7 — نموذجها الأقوى المتاح للجمهور. تؤكد الشركة القيادة على SWE-bench Pro برصيد 64.3% مقابل 57.7% لـ GPT-5.4، مع تحسن 14% في…

معالج بواسطة الذكاء الاصطناعي من TNW؛ بتحرير Hamidun News
أطلقت Anthropic Claude Opus 4.7 مع أفضل النتائج في البرمجة ومهام الوكلاء
المصدر: TNW. كولاج: Hamidun News.
◐ استمع للمقال

أطلقت Anthropic نموذج Claude Opus 4.7 وتراهن على أن المرحلة التالية من التنافس بين نماذج الذكاء الاصطناعي ستُحسم ليس فقط بجودة الإجابات، بل أيضاً بالقدرة على تنفيذ سلاسل العمل الطويلة بثبات واستقرار. يتم تحديد الإصدار الجديد كأقوى نموذج متاح للجمهور من الشركة: فهو يكتب ويصحح الأكواد بشكل أفضل، ويحافظ على السياق متعدد الخطوات بثقة أكبر، ويرتكب أخطاء أقل بشكل ملحوظ عند العمل مع الأدوات.

بالنسبة للسوق، هذه لحظة مهمة أيضاً لأنها لا تتعلق بعرض تجريبي، بل بنموذج يمكن شراؤه وتكامله مع سير العمل الآن. الحجة الرئيسية للإصدار هي النتائج على SWE-bench Pro، أحد أبرز المعايير لتقييم قدرة النماذج على حل مهام الهندسة الحقيقية. وفقاً للشركة، حققت Claude Opus 4.

7 نسبة 64,3%، بينما أظهرت GPT-5.4 نسبة 57,7%. بالنسبة للسوق، هذا إشارة مهمة: التركيز لا ينصب على "ذكاء" النموذج المجرد، بل على مدى قدرته على فهم قواعد الأكواد، والعثور على الأخطاء، واقتراح إصلاحات، ودفع المهام نحو نتيجة عملية.

تلاحظ مثل هذه الاختبارات بعناية خاصة من قبل الفرق التي تنفذ الذكاء الاصطناعي في التطوير والدعم والأتمتة الداخلية. التركيز الثاني لـ Anthropic هو السلوك الموكول للأجهزة الذكية. تتحدث الشركة عن تنسيق أقوى لعدة وكلاء في سيناريوهات قد تستمر لساعات.

الحديث يدور حول مهام حيث النموذج لا يجيب على طلب واحد فقط، بل يخطط الخطوات، يستدعي الأدوات، يفحص النتائج الوسيطة، ويستمر في العمل دون تدخل بشري مستمر. إنه في هذا الصنف من المهام بالذات حيث ينكشف الفرق بين عرض توضيحي مثير ونظام يمكن دمجه في عملية حقيقية: كلما طالت سلسلة الإجراءات، كلما ارتفعت تكاليف الأخطاء، وفقدان السياق، والاستدعاءات الخاطئة للأدوات. بالمقارنة مع الإصدارات السابقة، تشير Anthropic أيضاً إلى تحسن بنسبة 14% في الاستدلال الموكول متعدد الخطوات وثلاثة أضعاف أخطاء أقل عند العمل مع الأدوات.

إن كانت هذه الأرقام مؤكدة في الممارسة العملية، قد يكون هذا أهم حتى من الفرق في معيار واحد منفصل. بالنسبة لمستخدمي الشركات، عادة ما تُقيّم الموثوقية أكثر من الجودة القصوى: إذا كان النموذج نادراً ما "يعطل" سير العمل، ولا يفقد الحالة، ويستدعي الخدمات الخارجية بصورة أصح، فمن الأسهل السماح له بتنفيذ العمليات المتعلقة بالأكواد والتحليلات والمستندات والبوتات الداخلية. تشير الشركة أيضاً بشكل منفصل إلى زيادة ثلاثية في دقة الصور، مما يوسع السيناريوهات التي يمكن استخدام النموذج فيها لقراءة المخططات والواجهات والرسوم البيانية والمواد الأخرى الغنية بصرياً.

ظل السعر ضمن النطاق الذي تستخدمه Anthropic بالفعل للنماذج الرئيسية: 5 دولارات لكل مليون رمز إدخال و25 دولاراً لكل مليون رمز إخراج. هذا لا يبدو محاولة لإغراق السوق، لكنه يجعل الإصدار مفهوماً للعملاء الحاليين: الشركة تبيع ليس مجرد زيادة أخرى في الجودة، بل أداة أكثر موثوقية للعمل المعقد. بالنسبة للفرق التي تحسب الاقتصاديات من خلال المهام المكتملة، وليس فقط من خلال سعر الرمز، قد تكون هذه حجة قوية: يتطلب النموذج الأكثر استقراراً عمليات فحص يدوي أقل، وتشغيلات متكررة أقل، وتصحيحات أخطاء أقل بعد استدعاءات فاشلة.

في خضم السباق بين Anthropic و OpenAI و Google واللاعبين الآخرين، تبدو هذه الخطوة منطقية. الآن، الفائز ليس من يعلن بأعلى صوت عن "الذكاء العام"، بل من يتعامل نموذجه بشكل أفضل مع المهام التطبيقية: يكتب الأكواد، يدير الأدوات، يتحمل الجلسات الطويلة، ويسلم النتائج المتوقعة في ظروف واقعية. الخلاصة بسيطة: Claude Opus 4.

7 ليس تحديثاً تجميلياً، بل هو ترشح Anthropic للقيادة في قطاع النماذج للتطوير والأتمتة الموكولة للوكلاء. إذا ما تطابقت التحسينات الموعودة مع ما تراه الفرق في الإنتاج، فستتصاعد الضغوط على المنافسين ليس بسبب جداول المقارنة الجميلة، بل بسبب سؤال أكثر عملية: أي نموذج أرخص وأكثر أماناً لوضعه في قلب سير العمل الحقيقي.

ZK
Hamidun News
أخبار الذكاء الاصطناعي بدون ضوضاء. اختيار تحريري يومي من أكثر من 400 مصدر. منتج من جمال حميدون، رئيس الذكاء الاصطناعي في Alpina Digital.

هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟

AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.

ما رأيك؟
جارٍ تحميل التعليقات…