قدمت Agent-Infra بيئة AIO Sandbox — بيئة موحدة لوكلاء الذكاء الاصطناعي مع متصفح وـ Shell
أطلقت Agent-Infra بيئة AIO Sandbox — بيئة مفتوحة لوكلاء الذكاء الاصطناعي توحد المتصفح و Shell والطبقة المشتركة للملفات و MCP في حاوية Docker واحدة. بدلاً من…
معالج بواسطة الذكاء الاصطناعي من MarkTechPost؛ بتحرير Hamidun News
أطلقت Agent-Infra أداة AIO Sandbox — بيئة تنفيذ مفتوحة المصدر لوكلاء الذكاء الاصطناعي، حيث يتم تجميع متصفح وطرفية ونظام ملفات وخدمات MCP في حاوية واحدة. لا يهدف المشروع إلى تحسين نماذج الاستدلال، بل إلى حل مشكلة أكثر عملية: كيفية إعطاء الوكيل مكاناً معزولاً ومريحاً لإجراءات حقيقية.
عنق الزجاجة في الوكلاء
اليوم، يواجه العديد من سيناريوهات الوكلاء اختناقاً ليس في ذكاء النموذج، بل في البنية التحتية من حوله. يمكن لنماذج اللغة الكبيرة كتابة الكود وتخطيط الخطوات واستدعاء الأدوات، لكن بعد ذلك يبدأ الفوضى: يعمل المتصفح بشكل منفصل، و runtime Python بشكل منفصل، و shell بشكل منفصل، ويجب تمرير الملفات بينها يدويًا. كل عملية انتقال كهذه تضيف تأخيراً وتكسر حالة الجلسة وتتطلب كوداً لاصقاً إضافياً يصعب صيانته.
على الورق، يتم حل هذا باستخدام حاويات Docker، لكن في خطوط الأنابيب الحقيقية تظهر مشكلة أخرى — التجزئة. إذا قام وكيل بتنزيل ملف CSV عبر المتصفح، يجب تحويل هذا الملف إلى بيئة المعالجة، ثم حفظ النتيجة ونقلها إلى الأداة التالية. كلما زاد عدد الخطوات، كلما زادت مخاطر عدم التزامن والأخطاء على حدود الخدمات.
تحاول أداة AIO Sandbox إزالة طبقة الروتين الهندسي هذه بالضبط وإعطاء الوكيل مساحة عمل موحدة بدلاً من مجموعة من الوحدات المقترنة بشكل ضعيف.
ما بداخل Sandbox
في الأساس، أداة AIO Sandbox هي runtime Docker واحد حيث تم تجميع الواجهات الرئيسية اللازمة لوكيل حديث مسبقاً. بدلاً من تكوين أتمتة المتصفح والطرفية وبيئة التطوير والبروتوكول بشكل منفصل، يحصل المطور على بيئة جاهزة مع وصول أصلي إلى هذه المكونات. في المستودع، يُوصف المشروع بأنه بيئة sandbox شاملة موجهة نحو الوكلاء والمطورين الذين يريدون مراقبة وتصحيح واستنساخ سلوك النظام.
- Chromium مع الإدارة عبر CDP ودعم Playwright
- Python و Node.js runtimes محددة مسبقاً
- Terminal Bash وطبقة ملفات مشتركة لجميع الوحدات
- VSCode Server و Jupyter Notebook مدمجان للتصحيح
- خوادم MCP للمتصفح والملفات و shell وتحويل المستندات إلى Markdown
الفكرة الأساسية هي نظام ملفات موحد. الملف الذي يقوم الوكيل بتنزيله عبر Chromium يصبح متاحاً فوراً لنص Python أو أمر bash أو API ملفات دون نقل وسيط. بالنسبة لمهام الوكلاء، هذا أكثر أهمية مما يبدو: يمكنك فتح بوابة ويب وسحب البيانات وتنظيفها فوراً في Python وحفظ النتيجة في نفس مجلد العمل. تكامل MCP مفيد أيضاً بشكل منفصل: الأدوات مُحضّرة بالفعل ولا تتطلب توصيل يدوي من الفريق للعمليات الأساسية.
كيفية تشغيله
تؤكد Agent-Infra على أن Sandbox مناسب ليس فقط للتجارب المحلية بل أيضاً لنشر الإنتاج. تتضمن الوثائق بدءاً سريعاً عبر أمر Docker واحد، بالإضافة إلى أمثلة على Docker Compose و Kubernetes. يمكن تحديد الحاوية بواسطة CPU والذاكرة، ويتم تنفيذ كود الوكيل بشكل معزول عن نظام المضيف.
في الوقت نفسه، تبقى البيئة ذات حالة: يمكن الحفاظ على جلسات الطرفية وحالة العمل عبر مهام متعددة الخطوات بدلاً من إعادة تعيينها بعد كل إجراء.
فوق runtime، تتوفر واجهات برمجية (APIs) وحزم تطوير البرامج (SDKs) يمكن من خلالها للتطبيق قراءة وكتابة الملفات وتنفيذ أوامر shell والتحكم في المتصفح وتشغيل كود Jupyter وربط خدمات MCP. بصيغتها الجاهزة، واجهة VNC للتحكم البصري في المتصفح و VSCode Server لفحص أفعال الوكيل يدويًا متاحة أيضًا.
هذه الجموعة مفيدة بشكل خاص للفريق الذي يبني عوامل الويب أو سيناريوهات الأتمتة الداخلية أو خطوط الأنابيب الهجينة حيث يجب دمج التنقل في الموقع ومعالجة البيانات المحلية والعزل القابل للتحقق.
ماذا يعني هذا
إذا استمرت الاتجاهات نحو الأنظمة القائمة على الوكلاء، فإن مجال المنافسة التالي سيكون ليس فقط جودة النموذج بل أيضاً جودة بيئة التنفيذ. تُظهر أداة AIO Sandbox إلى أين يتجه السوق: نحو runtime قياسي حيث يكون المتصفح والكود والملفات وبروتوكولات الأدوات مترابطة بالفعل.
بالنسبة للفريق، هذه فرصة للإنفاق الأقل من الوقت على لصق البنية التحتية وإحضار الوكلاء من العرض التوضيحي إلى الخدمة العاملة بشكل أسرع.
هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟
AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.