MarkTechPost→ المصدر

Z.ai تطلق GLM-5V-Turbo — نموذج متعدد الأنماط الأصلي للبرمجة البصرية

أطلقت Z.ai (Zhipu AI) نموذج GLM-5V-Turbo — نموذج متعدد الأنماط يترجم الصور مباشرة إلى كود البرنامج. بخلاف نماذج VLM التقليدية، فإنه لا يقتصر على وصف القطات…

معالج بواسطة الذكاء الاصطناعي من MarkTechPost؛ بتحرير Hamidun News
Z.ai تطلق GLM-5V-Turbo — نموذج متعدد الأنماط الأصلي للبرمجة البصرية
المصدر: MarkTechPost. كولاج: Hamidun News.
◐ استمع للمقال

أطلقت شركة Zhipu AI، التي تعمل تحت العلامة التجارية Z.ai، نموذج GLM-5V-Turbo — وهو نموذج من فئة جديدة يجمع بين الرؤية الحاسوبية والهندسة البرمجية في بنية معمارية أصلية موحدة. على عكس معظم الأنظمة متعددة الأوضاع، لا يقتصر GLM-5V-Turbo على وصف الصور فحسب: بل يتمكن من ترجمة المعلومات البصرية مباشرة إلى كود برمجي عامل.

تم تحسين النموذج لمنصة OpenClaw وموجه نحو سير عمل الوكلاء عالية الحمل في هندسة البرمجيات. تكمن المشكلة التقليدية لنماذج الرؤية واللغة (VLMs) في الفجوة بين الإدراك والتنفيذ. تتعامل معظم هذه الأنظمة بشكل جيد مع وصف محتوى الصور، لكنها تواجه صعوبات عندما يتعلق الأمر بتحويل السياق البصري إلى صيغة برمجية صارمة.

هذا عائق خطير للتطبيق العملي للذكاء الاصطناعي في التطوير: لا يمكن للمهندس ببساطة أن يوضح للنموذج لقطة شاشة لواجهة المستخدم، أو مخطط قاعدة بيانات ERD، أو مخطط معماري والحصول على كود عامل في المقابل. كانت الخطوة الوسيطة — الترجمة اليدوية من البصري إلى النصي — تبقى من مسؤولية الإنسان، مما قلل بشكل كبير من قيمة الأنظمة متعددة الأوضاع في السيناريوهات الهندسية الحقيقية. يهاجم GLM-5V-Turbo هذه المشكلة بشكل مباشر.

من الناحية المعمارية، تم تصميم النموذج كنموذج أصلي متعدد الأوضاع: يتم معالجة السياقات البصرية والنصية معاً، دون خطوات فك تشفير وسيطة. هذا يسمح للنظام برؤية مخطط أو نموذج واجهة مستخدم أو مخطط بيانات وتوليد الكود المقابل مباشرة — سواء كان Python أو TypeScript أو SQL أو لغة أخرى. يتم تقليل الفجوة بين "ما هو معروض" و"كيفية تنفيذه" بشكل كبير، ويتم الحفاظ على جودة الكود المُنتج عند مستوى قابل للتطبيق على المشاريع الحقيقية.

السيناريو التطبيقي الرئيسي لـ GLM-5V-Turbo هو خطوط أنابيب الهندسة الموكلة. في هذه الأنظمة، ينفذ وكيل ذكاء اصطناعي سلسلة من المهام المترابطة: يحلل المتطلبات، ويصمم البنية المعمارية، ويكتب الكود والتحقق منه، ويكرر بناءً على نتائج الاختبارات. يوسع الإدخال متعدد الأوضاع بشكل كبير من نطاق المهام التي يمكن للوكيل التعامل معها بشكل مستقل: بدلاً من الأوصاف النصية، يمرر المهندس لقطات شاشة، ونماذج إطارية، ومخططات ERD، أو مخططات البيانات — ويتلقى كوداً في المقابل، وليس إعادة صياغة.

تم تحديد موضع GLM-5V-Turbo بالضبط كمكون من مكونات خطوط الأنابيب هذه، وليس كمساعد دردشة مستقل للطلبات الفردية. التحسين لمنصة OpenClaw هو نقطة مهمة أخرى. OpenClaw هو حل بنية تحتية لتشغيل نماذج اللغة الكبيرة في بيئة الإنتاج، مطلوب من قبل الفريق الذي تكون الكمون المنخفض والإنتاجية العالية حرجة بالنسبة لهم.

حقيقة أن Zhipu AI قامت بتكييف GLM-5V-Turbo بشكل خاص لهذه المنصة تشير إلى تركيز على النشر في المؤسسات، وليس على المعايير الأكاديمية. بالنسبة للمهندسين الممارسين، هذا يعني أنه تم تطوير النموذج مع مراعاة القيود التشغيلية للأنظمة الحقيقية — متطلبات السرعة والاستقرار والقابلية للتوسع. يندرج إطلاق GLM-5V-Turbo ضمن سباق أوسع نطاقاً نحو نماذج ترميز متعددة الأوضاع.

في الفترة من 2025 إلى 2026، أعلنت المختبرات الرائدة — الأمريكية والأوروبية والصينية — عن الترميز متعدد الأوضاع كأولوية للحدود التالية في قدرات الذكاء الاصطناعي. يقوم اللاعبون الصينيون، وخاصة Zhipu AI، بتوسيع حضورهم بشكل منهجي في هذا القطاع، ويقدمون نماذج متكاملة بإحكام مع منصات البنية التحتية الخاصة بهم. يخلق هذا النهج ميزة تنافسية على مستوى النظام البيئي: يظهر النموذج المُحسَّن لمجموعة معينة نتائج أفضل من الحل العام المنتشر على نفس الأجهزة.

بالنسبة لفرق الهندسة، فإن إطلاق GLM-5V-Turbo إشارة أخرى على أن الحدود بين "الرؤية" و"العمل" في عالم الذكاء الاصطناعي تتلاشى بسرعة. تغير الأنظمة القادرة على استقبال مخطط معماري كمدخل وإعادة كود جاهز للإنتاج العملية ذاتها لتصميم منتجات البرمجيات. هذا ليس مجرد تحسن في تجربة المستخدم — إنها إعادة تصور محتملة لسير عمل المطور في كل مرحلة من مراحل دورة حياة المنتج: من الفكرة الأولية إلى النشر.

ZK
Hamidun News
أخبار الذكاء الاصطناعي بدون ضوضاء. اختيار تحريري يومي من أكثر من 400 مصدر. منتج من جمال حميدون، رئيس الذكاء الاصطناعي في Alpina Digital.

هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟

AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.

ما رأيك؟
جارٍ تحميل التعليقات…