Habr AI→ المصدر

أطلقت OpenAI نموذج GPT-5.4: رهان على وكلاء الكمبيوتر لا على الكود فقط

في 5 مارس 2026، أطلقت OpenAI نموذج GPT-5.4، وهو نموذجها الرائد مع تحكم مدمج بالكمبيوتر وtool search ووضع xhigh للمهام المعقدة. وأبرز تحول فيه هو الانتقال من…

معالج بواسطة الذكاء الاصطناعي من Habr AI؛ بتحرير Hamidun News
أطلقت OpenAI نموذج GPT-5.4: رهان على وكلاء الكمبيوتر لا على الكود فقط
المصدر: Habr AI. كولاج: Hamidun News.
◐ استمع للمقال

أطلقت OpenAI في 5 مارس 2026 GPT-5.4 — نموذج جديد رائد يجمع بين الترميز القوي والاستدلال والتحكم الأصلي بالكمبيوتر. تحول التركيز الرئيسي للإصدار من "روبوت دردشة ذكي" إلى وكيل ذكاء اصطناعي لا يجيب على الأسئلة فقط، بل يمكنه أيضاً تنفيذ سلاسل من الإجراءات في الواجهات وأدوات العمل.

الرهان على الوكلاء

أهم أخبار GPT-5.4 هي Computer Use المدمجة. يمكن للنموذج العمل من لقطات الشاشة وإدارة المؤشر والنقر على الأزرار وملء النماذج والتحقق من النتائج.

بالنسبة للمطورين، هذا يعني انتقالاً أكثر نضجاً من مجرد توليد النصوص إلى سيناريوهات الوكلاء: يمكن للروبوتات التنقل في المواقع وتنفيذ خطوات المتصفح وتنفيذ العمليات الروتينية دون سيناريو مشفر لكل نقرة. هذا لم يعد ميزة لمقاطع الفيديو التوضيحية، بل طبقة أساسية للعمليات التجارية الحقيقية حيث يحتاج الوكيل إلى رؤية الواجهة والتأكد من أن الإجراء فعل نجح فعلاً. وفقاً للبيانات الرسمية من OpenAI، يكون التحسن ملحوظاً بشكل خاص حيث يجب على النموذج التصرف بشكل مستقل بدلاً من كتابة الكود في الفراغ.

على OSWorld-Verified، وصل GPT-5.4 إلى 75.0% مقابل 47.

3% لـ GPT-5.2، وعلى BrowseComp — 82.7% مقابل 65.

8%. في الوقت نفسه، كان التحسن في SWE-Bench Pro أكثر تواضعاً: 57.7% مقابل 55.

6%. هذه إشارة جيدة لمن يبنون المساعدين وكلاء سير العمل، وأكثر اعتدالاً لمن كان يتوقع نقطة اختراق غير مشروطة في البرمجة.

  • التحكم الأصلي بالكمبيوتر من خلال لقطات الشاشة والإجراءات على الواجهة
  • البحث عن الأداة للمجموعات الكبيرة من الأدوات دون تضخيم التعليمات
  • وضع الاستدلال `xhigh` للمهام الثقيلة
  • حتى 1 مليون رمز سياق في Codex مع دعم تجريبي
  • معدل أقل من الأخطاء الواقعية مقابل GPT-5.2

ما أظهرته الاختبارات

من الناحية العملية، لم تكن الصورة موحدة مثل مقاييس العرض التقديمي. في اختبار مرئي، طُلب من النموذج بناء لوحة تحكم منزل ذكي معقدة، ثم عرض النتيجة بنفسه وتصحيح الأخطاء بعد التحقق الذاتي. كانت التركيبة العامة والأسلوب قابلة للتعرف، لكن التفاصيل كانت مخيبة للآمال: تداخل النص مع الكتل والهوامش كانت غير محاذية وتم قطع بعض العناصر والمنظم الحراري النيومورفيك المعلن أصبح مجرد دائرة مبسطة.

بمعنى آخر، يلتقط النموذج بالفعل شعور "الواجهة الممتازة", لكنه لا يزال بعيداً عن كونه مطور واجهة أمامية أول بشكل مستقل. ومع ذلك، في السيناريو الخلفي، كان GPT-5.4 أكثر إقناعاً.

في مهمة حول محدود المعدل جاهز للإنتاج لـ FastAPI و Redis، لم يكتفِ النموذج بحل أساسي، بل بنى نظاماً كاملاً مع كتابة صارمة وسيناريو Lua للذرية وعودة محلية في حالة سقوط Redis. في اختبار منطقي مع ظروف جدولة متضاربة، عمل بشكل صحيح أيضاً: لم يخترع إجابة "بطريقة ما", بل أثبت بشكل متسق أنه لا يوجد حل. هذا مؤشر مهم على النضج: يعترف النموذج بالتناقضات بشكل أكثر تكراراً بدلاً من الهلوسة بثقة.

السعر والتوفر

أطلقت OpenAI GPT-5.4 في 5 مارس 2026 مباشرة في API و Codex و ChatGPT مثل GPT-5.4 Thinking.

اعتباراً من الإصدار، بدأ النموذج في استبدال GPT-5.2 Thinking لمستخدمي ChatGPT Plus و Team و Pro المدفوعين، بينما أصبح GPT-5.4 Pro متاحاً على مستويات Pro و Enterprise.

بالنسبة للمطورين، قد تكون هذه أخبار لا تقل أهمية عن المقاييس ذاتها: لم يبق النموذج الرائد الجديد عرضاً مخبرياً، بل تم دمجه مباشرة في المنتجات الإنتاجية. يبدو سعر API أكثر جرأة مما قد يتوقعه المرء من النموذج الرائد لـ OpenAI: 2.50 دولار لكل مليون رمز إدخال و 0.

25 دولار للإدخال المخزن مؤقتاً و 15 دولار لكل مليون رمز إخراج. نعم، النموذج أكثر تكلفة من GPT-5.2 لكل رمز، لكن OpenAI تراهن على كفاءة الرموز الأفضل: إذا حل الوكيل مهمة في خطوات أقل ولا يتحول كثيراً في السياق، فقد تكون الاقتصاديات الإجمالية معقولة تماماً حتى للفرق الصغيرة.

ما يعنيه هذا

لا يبدو GPT-5.4 وكأنه "استبدال سحري للمطور", لكنه يوضح بوضوح إلى أين يتجه السوق. المنافسة التالية ليست فقط على جودة الإجابات، بل على قدرة النموذج على رؤية الواجهات واستخدام الأدوات وتذكر السياق الطويل وإكمال المهام. بالنسبة للعمل، هذا يعني شيئاً بسيطاً: القيمة تتحول من التعليمات الفردية إلى الوكلاء الذين يمكنهم العمل ضمن العمليات الحقيقية. في مثل هذه السيناريوهات سيتم حل السؤال حول أي منصة تناسب العمل الحقيقي بشكل أفضل — بدلاً من عروض توضيحية رائعة منفردة.

ZK
Hamidun News
أخبار الذكاء الاصطناعي بدون ضوضاء. اختيار تحريري يومي من أكثر من 400 مصدر. منتج من جمال حميدون، رئيس الذكاء الاصطناعي في Alpina Digital.

هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟

AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.

ما رأيك؟
جارٍ تحميل التعليقات…