OpenAI Blog→ المصدر

OpenAI Codex для долгих задач: приёмы сохранения контекста от Джейсона Лю

OpenAI опубликовала кейс о том, как разработчик Джейсон Лю использует Codex для долгих многоэтапных задач. Главный вопрос — как сохранить контекст проекта…

معالج بواسطة الذكاء الاصطناعي من OpenAI Blog؛ بتحرير Hamidun News
OpenAI Codex для долгих задач: приёмы сохранения контекста от Джейсона Лю
المصدر: OpenAI Blog. كولاج: Hamidun News.
◐ استمع للمقال

OpenAI Codex للمهام الطويلة: تقنيات الحفاظ على السياق من جيسون ليو

نشرت OpenAI مادة حول كيفية قيام جيسون ليو، مطور وممارس الذكاء الاصطناعي، بتطبيق Codex للمهام الطويلة والمتعددة المراحل—ولماذا لا ينجح النهج القياسي "مطالبة واحدة، إجابة واحدة" للمشاريع الحقيقية.

لماذا مطالبة واحدة غير كافية

معظم حالات استخدام مساعدات الترميز القائمة على الذكاء الاصطناعي هي مهام قصيرة: إصلاح خلل، كتابة دالة، شرح قطعة كود. لكن التطوير الحقيقي أكثر تعقيداً: يتراكم في المشروع تاريخ من القرارات والاعتماديات بين الوحدات والاتفاقيات حول الأسلوب والعمارة—كل ما لا يمكن أن يناسب مطالبة واحدة. وهنا يواجه معظم المطورين جداراً. في كل مرة تحتاج إلى إعادة شرح السياق، والوكيل "لا يتذكر" أنه في الأمس قررت التخلي عن نهج معين أو أن الاختبارات تغطي فقط جزءاً من الحالات. صُمم Codex من OpenAI للعمل في وضع الوكيل: يمكنه تنفيذ المهام بشكل متزامن، وتشغيل الاختبارات والتكرار بناءً على النتائج. وفي هذا الوضع—كمنفذ كامل بدلاً من الإكمال التلقائي—يرى ليو أكبر إمكانات الأداة.

تقنيات "Codex-Maxxing"

يقوم نهج ليو على عدة ممارسات تسمح لـ Codex "بالتذكر" ومتابعة العمل بين الجلسات:

  • نقل الحالة—في بداية كل جلسة، يتلقى Codex ملفاً منظماً يحتوي على حالة المشروع الحالية والقرارات المتخذة والأسئلة المفتوحة.
  • تحليل المهام—تُقسَّم المهام الكبيرة إلى أشجار فرعية مستقلة، يمكن للوكيل حل كل منها بشكل مستقل دون الحاجة إلى السياق الكامل للمشروع بأكمله.
  • مطالبات نقاط التفتيش—في نهاية الجلسة، يُنتج الوكيل تقرير ملخص لما تم إنجازه وما تبقى. يصبح هذا التقرير نقطة الانطلاق للتشغيل التالي.
  • تفويض الفروع الكاملة—بدلاً من السيطرة خطوة بخطوة، يصف المطور الهدف ومعايير القبول، ويكرر Codex بشكل مستقل حتى يحقق النتيجة المرغوبة.
  • تثبيت البيئة—يتم تثبيت إصدارات الاعتماديات والأدوات بشكل صارم لضمان عدم كسر الوكيل لقابلية التكرار بين التشغيلات.

معاً، تسمح هذه التقنيات لـ Codex بالعمل لساعات على مهام معقدة—بدون الحضور المستمر للمطور.

تغيير دور المطور

الشيء الأهم في نهج ليو ليس الحيل التقنية، بل تحول في طريقة التفكير. يتوقف المطور عن كونه منفذاً ويصبح معماراً للمهام. مهارته الرئيسية الآن هي وصف النية بدقة وإدارة السياق وتقييم نتائج الوكيل بشكل حاسم، بدلاً من كتابة الكود يدويّاً. يصبح المطور الذي يمكنه "إطعام" الوكيل السياق بشكل صحيح وصياغة المهام أكثر إنتاجية بشكل كبير. مع التنظيم الصحيح، يمكن لشخص واحد إدارة عدة فروع متوازية، يقودها Codex.

لماذا تنشر OpenAI هذا

ظهرت المادة في لحظة تقوم فيها OpenAI بتعزيز حالات الاستخدام القائمة على الوكيل لـ Codex بنشاط. إنها جزء من سرد أوسع: تنتقل أدوات الذكاء الاصطناعي من دور المساعد إلى دور المنفذ المستقل في مقاطع عمل محددة. والجدير بالملاحظة أن ليو ليس مستخدماً عادياً: أنشأ مكتبة Instructor، التي أصبحت المعيار الفعلي للحصول على استجابات منظمة من نماذج اللغات الكبيرة. تستند وجهة نظره حول سير عمل الوكيل على خبرة حقيقية في تطوير أنظمة الذكاء الاصطناعي، وليس على وعود التسويق. بالنسبة لسوق العمل، يشير الإصدار إلى تحول في القيمة. سينخفض الطلب على المطورين المشغولين بمهام روتينية. بدلاً من ذلك، سيزداد الطلب على أولئك الذين يمكنهم تحليل المهام المعقدة وبناء السياق للوكلاء والتحقق من جودة النتائج.

ما يعني هذا

حالة ليو هي واحدة من أول الأمثلة المنظمة لكيفية العمل فعلاً مع وكلاء الذكاء الاصطناعي على مستوى المشاريع المعقدة، وليس سيناريوهات العروض التوضيحية. إذا دخل وضع الوكيل في Codex سير العمل القياسي، ستصبح مهارات "codex-maxxing" أداة أساسية لكل مطور جاد.

ZK
Hamidun News
أخبار الذكاء الاصطناعي بدون ضوضاء. اختيار تحريري يومي من أكثر من 400 مصدر. منتج من جمال حميدون، رئيس الذكاء الاصطناعي في Alpina Digital.

هل تحتاج إلى ذكاء اصطناعي يعمل داخل شركتك — وليس فقط في موجز الأخبار؟

أبني ذكاءً اصطناعياً جاهزاً للإنتاج للشركات — أنظمة CRM مخصّصة، أدوات داخلية، وكلاء مستقلون، أتمتة سير العمل. ملك لك، مصمّم وفق عمليتك، دون رسوم لكل مستخدم. من إعداد جمال خميدون، مدير المنتجات في AlpinaGPT (منصة ذكاء اصطناعي، أكثر من 6000 مستخدم).

ما رأيك؟
جارٍ تحميل التعليقات…