كشفت H Company عن Holo3 — وكيل AI للعمل على الكمبيوتر برقم قياسي في OSWorld-Verified
كشفت H Company عن Holo3، وهو نموذج للعمل على الكمبيوتر حقق 78.85% في OSWorld-Verified. ولا تراهن الشركة على الاختبار المعياري وحده: فقد تدرّب النظام على…
معالج بواسطة الذكاء الاصطناعي من Hugging Face Blog؛ بتحرير Hamidun News
قدّمت شركة H شركة (H Company) نموذج Holo3 — وهو نموذج جديد للعمل على الحاسوب حقّق، وفقاً للشركة، نسبة 78.85% في معيار OSWorld-Verified وأصبح رائداً بين أنظمة computer use. يُوضّع النموذج ليس كنموذج أولي في المختبر، بل كأساس لوكلاء تعاونيين قادرين على العمل مع الواجهات الحقيقية والمهام المتعددة الخطوات.
الرقم القياسي في OSWorld
الرقم الرئيسي في الإعلان هو 78.85% في OSWorld-Verified، وهو أحد أهم معايير تقييم كيفية قيام النماذج بالعمل على حاسوب عادي. تؤكد شركة H Company أن Holo3 لا يحقق درجة عالية فحسب، بل يحافظ عليها مع تكوين صغير نسبياً: يمتلك النموذج 10 مليارات معامل نشط من أصل 122 مليار معامل إجمالي. تقارن الشركة التكاليف على حدة مع الأنظمة المغلقة الأكبر مثل GPT 5.4 و Opus 4.6، وتعد بالاستدلال الأرخص. الأوزان العامة لـ Holo3-35B-A3B متاحة بالفعل على Hugging Face بموجب رخصة Apache 2.0.
كيفية تدريبه
أساس Holo3 هو ما يُسمى agentic learning flywheel — دورة تعلم مستمرة تحسّن شيئين: إدراك الواجهة واتخاذ القرار. بدلاً من مجموعة واحدة من لقطات الشاشة أو السيناريوهات اليدوية، تبني الفريق سلسلة من المهام التي يتعلم عليها النموذج فهم الشاشة واختيار الخطوة التالية والحفاظ على السياق في تسلسلات طويلة من الإجراءات. تم وضع تركيز خاص على التعميم: يتم تدريب النظام ليس على منتج واحد، بل على فئة من الواجهات التي قد يواجهها في عمله.
- Synthetic Navigation Data — سيناريوهات التنقل المجمعة من التعليمات البشرية والمولدة.
- Out-of-Domain Augmentation — التوسع البرمجي للسيناريوهات حتى لا ينكسر الوكيل عند مواجهة واجهات غير متوقعة والانحرافات عن القوالب.
- Curated Reinforcement Learning — تصفية البيانات والتعلم المعزز لتعظيم الدقة في المهام الحقيقية.
الفكرة هي التدريب ليس على نظام CRM معين أو موقع ويب واحد، بل على مهارة أكثر عمومية للعمل مع الواجهات. لهذا السبب تراهن شركة H Company ليس فقط على درجة المعيار النهائية، بل على قابلية التحويل: إذا كان النموذج يفهم منطق الشاشات ويستطيع اتخاذ القرارات خطوة بخطوة، يكون من الأسهل تكييفه مع الأنظمة الجديدة دون إعادة تدريب كاملة. هذا مهم بشكل خاص للبرمجيات المؤسسية، حيث تكون الواجهات في الغالب غير قياسية وتتغير أسرع مما يمكن تحديث مجموعات البيانات.
المكتب الاصطناعي
للتحقق مما إذا كان هذا النهج يعمل خارج المختبر، بنت الشركة Synthetic Environment Factory — مصنع البيئات المؤسسية الاصطناعية. تقوم وكلاء الترميز تلقائياً بتجميع مواقع الويب والواجهات من الصفر وفقاً للمواصفات المحددة، وبعد ذلك يتم توليد مهام قابلة للتحقق بدرجات تعقيد مختلفة لها. على هذا الأساس، أنشأت شركة H Company مجموعة منفصلة من H Corporate Benchmarks: 486 مهمة واقعية متعددة الخطوات في أربع فئات — التجارة الإلكترونية والبرمجيات الأعمال وأدوات التعاون وسيناريوهات التطبيقات المتعددة. هذا أقرب بالفعل ليس لعروض اللعب، بل لكيفية عمل الموظفين بالفعل داخل شركة. تتطلب أصعب المهام تنسيقاً بين أنظمة متعددة في نفس الوقت.
مثال من المقالة: يجب على الوكيل استخراج أسعار المعدات من ملف PDF، ومقارنتها مع الميزانية المتبقية لكل موظف، ثم إرسال رسائل شخصية تلقائياً بالموافقة أو الرفض. بالنسبة لسلسلة مثل هذه، فإن مجرد التعرف على النص على الشاشة غير كافٍ. تحتاج إلى حسابات ومعالجة المستندات وذاكرة للخطوات الوسيطة والقدرة على عدم فقدان الهدف في عملية العملية. وفقاً لشركة H Company، على مثل هذه السيناريوهات يُظهر Holo3 ميزة على نماذج أساسية Qwen3.5 ويتقدم في اختبارات single-app.
ماذا يعني هذا
يتحول سوق وكلاء الذكاء الاصطناعي للعمل على الحاسوب بشكل متزايد من العروض التوضيحية إلى سيناريوهات المنتج: فليس كافياً أن تتمكن من النقر على الشاشة، بل يجب أن تتعامل أيضاً مع الروتين المؤسسي والواجهات غير القياسية. Holo3 مثير للاهتمام بدقة لهذا التركيز. إذا تم التحقق من النتائج المعلنة خارج الاختبارات الداخلية، ستحصل الشركات على مرشح حقيقي آخر لدور وكيل الذكاء الاصطناعي المكتبي، وليس مجرد نموذج آخر للجداول. هذا بالفعل منافسة ليس فقط على جودة النموذج، بل على الاستعداد للعمل المكتبي الحقيقي.
هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟
AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.