OpenAI تدمج تقنيات Sky في Codex لنظام Mac وتعزّز إدارة التطبيقات في الخلفية
دمجت OpenAI تقنيات Sky في Codex لنظام Mac وعزّزت بشكل كبير وضع إدارة الحاسوب. يعمل الوكيل الآن مع تطبيقات متعددة في الخلفية، ويستخدم مؤشرات متوازية، ويعتمد…
معالج بواسطة الذكاء الاصطناعي من Habr AI؛ بتحرير Hamidun News
حولت OpenAI Codex لـ Mac من أداة لكتابة الأكواد إلى مشغل سطح مكتب كامل: يمكن للعامل الآن إدارة التطبيقات في الخلفية، والتبديل بين نوافذ متعددة، وتنفيذ المهام الروتينية دون نقلها إلى المقدمة ودون الحاجة إلى تدخل مستخدم مستمر.
يتعلق التحديث الرئيسي بتقنية Sky — وهي شركة ناشئة في macOS استحوذت عليها OpenAI رسميًا مع فريق المطورين.
على مستوى المنتج، لا يبدو هذا وكأنه تجربة جانبية. يتمتع Codex الآن بوضع تحكم بالكمبيوتر مدمج يسمح للعامل برؤية المكان الذي ينقر عليه وإدخال النصوص وفتح التطبيقات والعمل في عدة نوافذ في نفس الوقت.
ما يهم هو أن كل هذا يحدث في الخلفية: يمكن للمستخدم متابعة عمله بينما يتعامل العامل في نفس الوقت مع المهام في تطبيقات أخرى.
بالنسبة لبيئة Mac، حيث لا تزال العديد من العمليات تفتقر إلى الأتمتة الجيدة، هذا هو تحول ملحوظ.
من الناحية الفنية، الطريقة الجديدة مثيرة للاهتمام لأن Codex لا يعتمد فقط على تسجيل الشاشة ومحاكاة النقرات بناءً على الصور. بدلاً من ذلك، يستخدم النظام آليات إمكانية الوصول في macOS التي تسمح بقراءة التسلسل الهرمي للعناصر في الواجهة — الأزرار والحقول النصية والقوائم والألسنة والعناصر الأخرى داخل النافذة.
بالنسبة لنموذج اللغة، هذا أغنى بكثير من لقطة الشاشة البسيطة: فهو يتلقى ليس مجرد صورة، بل وصفًا منظمًا للواجهة ويمكنه فهم ما أمامه بدقة أكبر.
نتيجة لذلك، يجد العامل أنه من الأسهل اختيار الإجراء الصحيح ويعتمد بشكل أقل على السيناريوهات الهشة مع إحداثيات المؤشر أو السكريبتات البديلة.
هذا هو السبب في أن النسخة الجديدة من Codex تبدو أقوى من العديد من الحلول المنافسة.
لا تزال معظم أنظمة التحكم بالكمبيوتر اليوم مبنية على مزيج من لقطات الشاشة والتعرف البصري على الأحرف والأتمتة الأساسية من خلال أوامر النظام. هذا الأسلوب يعمل طالما الواجهة يمكن التنبؤ بها، لكنه ينهار سريعًا في التطبيقات الحقيقية.
يتعامل Codex، بناءً على التقييمات الأولية، بشكل أفضل مع المهام التي تتطلب التنقل بين نوافذ معقدة وتمرير التغذيات الطويلة وفتح العناصر المتداخلة وتنفيذ سلاسل الإجراءات بالتسلسل.
ومن المميزات الإضافية المؤشرات المتوازية: يمكن لعدة عوامل العمل على نفس جهاز Mac في نفس الوقت دون التداخل مع بعضها البعض أو سرقة التركيز.
القيمة العملية للتحديث واضحة في السيناريوهات اليومية. يمكن لـ Codex فتح تطبيق موسيقى وتشغيل الألبوم الصحيح، حتى لو لم تكن الأوامر منصوغة بشكل مثالي. يمكنه مراجعة عدة تطبيقات عمل — على سبيل المثال، رسول وعميل RSS وقارئ — ثم تجميع ملخص موجز منها.
يمكنه تثبيت الملفات وفتحها والتحقق من النتيجة ومتابعة تصحيح الأخطاء دون التبديل اليدوي بين النوافذ.
غالبًا ما يستطيع الإنسان القيام بمثل هذه الإجراءات بشكل أسرع، لكن هذا ليس هو النقطة الرئيسية: يتولى العامل العمل الروتيني الذي يمكن تنفيذه في الخلفية، خاصة حيث لا توجد API أو أوامر وحدة تحكم أو دعم AppleScript كامل.
بالنسبة لـ OpenAI، هذه أيضًا خطوة استراتيجية. يبدو Codex أقل وأقل مثل مساعد رموز عادي وأكثر فأكثر مثل مركز التحكم بالعوامل.
أولاً، أطلقت الشركة تطبيق Codex لـ macOS في 2 فبراير 2026، وفي 16 أبريل أضافت تحديثًا رئيسيًا يتضمن التحكم بالكمبيوتر في الخلفية والذاكرة والأتمتة والمكونات الإضافية الجديدة.
وفقًا لـ OpenAI، يستخدم الخدمة بالفعل أكثر من 3 ملايين مطور أسبوعياً، وتحاول الشركة بوضوح توسيع حالات الاستخدام خارج IDE: من كتابة الأكواد إلى اختبار الواجهة والعمل مع المستندات والمتصفحات والتطبيقات سطح المكتب.
الاستنتاج الرئيسي بسيط: OpenAI تراهن ليس فقط على نماذج أقوى، بل على سيطرة أعمق على بيئة المستخدم.
إذا حافظ Codex حقًا على دقته وسرعته الحالية، فقد ينتقل سوق وكلاء الذكاء الاصطناعي بسرعة من نوافذ الدردشة إلى مساعدين خلفيين يمكنهم العمل في التطبيقات الحقيقية بثقة مثل طريقة عملهم مع النصوص والرموز اليوم.
هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟
AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.