xAI запустила /goal в Grok Build: автономный агент планирует и верифицирует многошаговые задачи
xAI добавила в Grok Build режим /goal — автономное выполнение длинных многошаговых задач без ручного контроля каждого шага. Вы передаёте одну цель, агент сам…
معالج بواسطة الذكاء الاصطناعي من MarkTechPost؛ بتحرير Hamidun News
أطلقت xAI وضع /goal في Grok Build: وكيل مستقل يخطط ويتحقق من المهام متعددة الخطوات
أطلقت xAI وضع /goal في Grok Build — أداة لتنفيذ مستقل للمهام الطويلة متعددة الخطوات التي تبني خطة بمفردها وتعمل عبر قائمة تدقيق وتتحقق من النتيجة حتى الانتهاء التام.
كيف يعمل /goal
يختلف مبدأ التشغيل عن الحوار المعتاد مع نموذج لغة كبير. تقوم بصياغة هدف واحد — على سبيل المثال، "تنفيذ المصادقة عبر OAuth" أو "كتابة واختبار محلل JSON" أو "ترحيل مكون من class إلى hooks" — وتسلمه للوكيل. ثم /goal يتولى التحكم.
يقوم الوكيل بتحليل المهمة وبناء خطة خطوة بخطوة وتقسيمها إلى إجراءات محددة. يتم تنفيذ كل إجراء بشكل مستقل: يكتب الوكيل الكود وينفذ الأوامر ويتحقق من النتائج الوسيطة. إذا حدث خطأ ما — فإنه يصحح النهج بدون مشاركتك. تتكرر دورة التخطيط → التنفيذ → التحقق حتى يتم تحقيق الهدف الأصلي بالكامل.
في الوضع المعتاد، يجري المطور حوارًا مع نموذج لغة كبير: يعطي موجهًا ويحصل على إجابة ويصحح ويوضح ويسأل مرة أخرى. في /goal، أنت تفوض ليس فقط تنفيذ المهمة بل إدارة العملية برمتها. هذا مستوى مختلف تمامًا من الاستقلالية.
التحقق المدمج من النتيجة
الميزة الرئيسية للوضع هي التحقق المدمج في كل خطوة. لا ينفذ /goal الخطوات بشكل ميكانيكي بالتسلسل: بعد كل مرحلة، يقيّم الوكيل ما إذا كانت النتيجة الوسيطة تطابق التوقعات فقط بعد ذلك يتقدم.
بالنسبة لمهام الترميز متعددة الخطوات، هذا حرج:
- كتابة الكود — الخطوة 1 وليست النتيجة النهائية
- تشغيل الاختبارات والتأكد من نجاحها — الخطوة 2
- التحقق من أن الكود الجديد لم يكسر السلوك الموجود — الخطوة 3
- تأكيد تحقيق الهدف بالكامل — التحقق النهائي
الافتقار إلى التحقق هو أحد أكثر الشكاوى شيوعًا حول وكلاء الترميز الموجودين. أكملت الأداة "تقنيًا" المهمة لكن النتيجة لا تطابق ما هو مطلوب. الأخطاء "الصامتة" — عندما يتقدم الوكيل بثقة في الاتجاه الخاطئ — هي أحد أصعب السيناريوهات في الأنظمة المستقلة. يحاول /goal معالجة هذا.
/goal في سياق السوق
تضع xAI Grok Build كبيئة تطوير كاملة حيث يشارك Grok في دورة إنشاء الكود بدلاً من الإجابة ببساطة على الأسئلة. /goal هو الخطوة التالية في هذه الإستراتيجية.
"تمرر هدفًا واحدًا ويخطط الوكيل النهج ويعمل عبر قائمة التدقيق ويتحقق
من النتيجة حتى الانتهاء"، — هذا كيف تصف فريق xAI الوضع.
يصبح سوق الوكلاء للمطورين مشبعًا. يوفر GitHub Copilot Workspace جلسات تخطيط متعددة الخطوات مباشرة في المستودع. يضع Devin من Cognition نفسه كوكيل مطور مستقل تمامًا. تدمج JetBrains وCursor وأدوات IDE الأخرى قدرات الوكيل. تطور Google وAnthropic أوضاع وكيل في منصاتهما. في هذا السياق، /goal هو رد منطقي من xAI: وضع مستقل حيث يعمل المستخدمون بالفعل مع الكود.
من الجدير بالملاحظة أن الوكلاء المستقلين يتحولون إلى ميزة قياسية بسرعة ملحوظة بدلاً من التطوير التجريبي. منذ عام مضى كانت مثل هذه القدرات مقتصرة على أدوات B2B متخصصة. اليوم يتم نشرها مباشرة في المنتجات الشاملة للمطورين.
ما يعنيه هذا
عندما تخطط أداة وتنفذ وتتحقق بمفردها، ينتقل المطور إلى وضع وضع المهام بدلاً من إدارة كل خطوة. بالنسبة للمشاريع الطويلة للترميز هذا يغير كل السيناريو العملي. السؤال لم يعد ما إذا كانت الوكلاء المستقلون مطلوبين — فهم هنا. السؤال هو مدى موثوقيتهم في التعامل مع التحقق عندما تكون المهمة معقدة حقًا.
هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟
AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.
أهم ما في عالم الذكاء الاصطناعي — مرة كل أسبوع
سبع قصص مهمة فعلاً هذا الأسبوع، مختارة بعناية. بلا ضجيج ولا بيانات صحفية.
تم! تحقق من بريدك للتأكيد.