ZDNet AI→ المصدر

ChatGPT Images 2.0: اختبار للهوية البصرية والنص والإنفوغرافيك — مُبهر، لكن ليس بلا أخطاء

تعلّم ChatGPT Images 2.0 تنفيذ ما لم ينجح فيه من قبل أي مولد جماهيري: إدراج النص بشكل صحيح داخل الصور، وإنشاء الإنفوغرافيك، والتعامل مع الهوية البصرية. وأجرت…

معالج بواسطة الذكاء الاصطناعي من ZDNet AI؛ بتحرير Hamidun News
ChatGPT Images 2.0: اختبار للهوية البصرية والنص والإنفوغرافيك — مُبهر، لكن ليس بلا أخطاء
المصدر: ZDNet AI. كولاج: Hamidun News.
◐ استمع للمقال

ChatGPT Images 2.0 هو أكبر ترقية لتوليد الصور في ChatGPT في الآونة الأخيرة. أجرى صحفي من ZDNet سلسلة من الاختبارات العملية واكتشف: يحقق النموذج قفزة كبيرة للأمام، خاصة في العمل مع النصوص والعلامات التجارية والرسوم البيانية — وإن كان ليس بدون أخطاء.

ما الذي تغير في Images 2.0

المشكلة الرئيسية لتوليد الصور بالذكاء الاصطناعي لعدة سنوات كانت النص. كانت الأجيال السابقة من النماذج إما تتجنب تماماً النص في الإطارات أو تنتج هراء غير قابل للقراءة من شبه الأحرف. يتعامل ChatGPT Images 2.0 مع هذا بطريقة مختلفة جذرياً: العناوين وتسميات الرسوم البيانية والكتل النصية الصغيرة في الرسوم البيانية — كل شيء يخرج قابلاً للقراءة وموضوعاً في الأماكن الصحيحة.

التحول الكبير الثاني هو العمل مع العلامات التجارية. يفهم النموذج الطلبات لإنشاء عناصر بصرية بأكواد لونية محددة وطباعة معينة وعناصر العلامة التجارية. يفتح هذا حالة استخدام جديدة — النماذج الأولية السريعة للمواد التسويقية دون مشاركة المصمم.

كيف سارت الاختبارات

اختبر الصحفي بشكل منهجي Images 2.0 على عدة مهام عملية:

  • إنشاء رسوم بيانية مع البيانات والمحاور والتسميات
  • توليد بطاقات مع العلامة التجارية والنص والشعار
  • إعادة إنتاج أسلوب تصميم محدد — الألوان والخطوط والتركيب
  • تحضير عناصر بصرية للشبكات الاجتماعية والعروض التقديمية
  • دقة نقل النص — العناوين والنقاط والبيانات الرقمية

الاستنتاج العام — "مثير للإعجاب، لكن أحياناً يرتكب أخطاء." حيث تكون الطلبات واضحة والتخطيط بسيط، تكون النتائج جيدة باستمرار. لكن على الخطوط غير القياسية والشبكات متعددة الأعمدة المعقدة أو كتل نصية متعددة في نفس الوقت، يمكن للنموذج أن ينتج تشويهات ويسيء محاذاة العناصر.

التطبيق في العالم الحقيقي

رغم الأخطاء، Images 2.0 قابل للتطبيق بالفعل على مهام عمل محددة — وهذا لم يكن واضحاً منذ بضعة أشهر فقط.

الرسوم التوضيحية السريعة للمواد. للمدونات والمقالات والمستندات الداخلية — يستغرق التوليد ثواني بدلاً من ساعات في Figma أو Photoshop. النتيجة ليست تصميماً نهائياً، بل مسودة جيدة بما يكفي للمناقشة الأولى.

نماذج العناصر البصرية التسويقية. إذا كنت بحاجة لإظهار عميل أو فريق الشكل التقريبي للافتة أو بطاقة أو إعلان — يعمل Images 2.0 كأداة للمسودة الأولى.

رسوم بيانية بدون مصمم. مع الاستفسار الصحيح، يهيكل النموذج البيانات ويضعها على الصورة — شيء كان يتطلب سابقاً Canva أو Piktochart أو مهمة منفصلة للمصمم.

"هذا أكثر متعة مما توقعت — ومفيد بشكل مفاجئ للعمل الحقيقي," — استنتاج

اختبارات ZDNet.

حيث لا تزال المشاكل قائمة

يعمل Images 2.0 بشكل أفضل كثيراً مع التعليمات المحددة والمفصلة. الطلبات الغامضة أو العامة جداً لا تزال غالباً تنتج نتائج غير مرضية. عيب آخر — عدم القدرة على التنبؤ: قد ينتج نفس الاستفسار في طلبات مختلفة نتائج مختلفة بمستويات جودة متغيرة.

لا توجد سيطرة مباشرة على المعاملات: لا يمكنك تعريف شبكة بصرامة أو تحديد موضع دقيق للعناصر أو استخدام خطوط مخصصة. بالنسبة للعمل التصميمي الاحترافي، يبقى هذا قيداً كبيراً.

ماذا يعني هذا

ChatGPT Images 2.0 ليس بديلاً للمصممين وليس "قاتل Midjourney." لكنه أول منتج توليد ذكاء اصطناعي في منتج سوق الكتل الشامل يتعامل حقاً وباستمرار مع النصوص والعلامات التجارية في الصور. بالنسبة لمن يريد إنشاء عنصر بصري فعال بسرعة بدون مهارات خاصة — هذه أداة عملية بالفعل، وليست تأثير عرض توضيحي.

ZK
Hamidun News
أخبار الذكاء الاصطناعي بدون ضوضاء. اختيار تحريري يومي من أكثر من 400 مصدر. منتج من جمال حميدون، رئيس الذكاء الاصطناعي في Alpina Digital.

هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟

AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.

ما رأيك؟
جارٍ تحميل التعليقات…