تفوقت Gemini 3.1 Pro على ChatGPT 5.4 وClaude Opus 4.6 في اختبار لتوليد النصوص
فازت Gemini 3.1 Pro في مقارنة بين نماذج توليد النصوص أمام ChatGPT 5.4 وClaude Opus 4.6. وأخضع المؤلف الأنظمة الثلاثة لأربع مهام: الكوميديا، الفانتازيا، الرعب…
معالج بواسطة الذكاء الاصطناعي من Habr AI؛ بتحرير Hamidun News
أصبحت Gemini 3.1 Pro الفائزة في مقارنة نماذج توليد النصوص من تأليف المؤلف، متفوقة على ChatGPT 5.4 و Claude Opus 4.6. كان الفارق صغيراً، لكن المؤلف أطلق على Gemini وصف الأداة الأكثر توازناً للمهام الأدبية والعاطفية.
كيفية الاختبار
لم تُبنَ المقارنة على البرامج أو البحث أو الرياضيات، بل على ما يبقى السيناريو الأساسي للذكاء الاصطناعي بين المستخدمين العاديين: كتابة النصوص. لهذا الغرض، تلقت ثلاثة نماذج أربع مهام. كان عليها أن تنشئ خيالاً علمياً كوميدياً وخيالاً كلاسيكياً ورعباً نفسياً وقصة عاطفية قصيرة عن شخص ضاع في الغابة. الحد الأقصى للنقاط في كل جولة كان ثلاث نقاط، وكان التقييم الإجمالي يعتمد على دقة الفئة والقراءة والملاءمة التفاصيل والانطباع العام للنتيجة.
تبين أن الأسلوب كان ذاتياً، لكن تلك بالضبط قيمته. لا يقيس هذا الاختبار الذكاء المجرد، بل يُظهر كيف يتصرف النموذج في مهمة تحرير حقيقية: هل يحافظ على النبرة، يحافظ على البنية، يتجنب الإطناب المفرط، وهل يستطيع نقل العاطفة بدون شروحات غير ضرورية. لاحظ المؤلف بشكل منفصل أن بعض النماذج تميل إلى إثقال النص، بينما اختار آخرون الإيجاز. لتوليد المنشورات والمسودات والقصص والسيناريوهات، هذا غالباً أهم من المقاييس الجافة.
النتائج حسب النموذج
أظهرت Gemini 3.1 Pro أفضل نتيجة — 11.5 من 12 نقطة ممكنة. تعاملت بثقة مع مهمة الكوميديا وتفوقت على غيرها في القصة العاطفية عن القلق في الغابة. أكمل Claude Opus 4.6 الاختبار بـ 11 نقطة، و ChatGPT 5.4 بـ 10. لم يفشل أي منهما: أظهرت جميع النماذج الثلاثة مستوى عالياً بشكل عام واختلفت أكثر في الأسلوب منها في الجودة.
- Gemini 3.1 Pro — 11.5 نقطة؛ قوية في دقة الفئة والعرض الموجز
- Claude Opus 4.6 — 11 نقطة؛ تبني الأجواء جيداً، لكنها تثقل النص أحياناً
- ChatGPT 5.4 — 10 نقاط؛ مستقرة، لكنها تتخذ أحياناً خيارات أسلوبية مشكوك فيها
- في مهمة الرعب، تلقت جميع النماذج الثلاثة نقاط متطابقة بـ 2.5
- أطلق المؤلف على نموذج OpenAI وصف الأكثر اقتصاداً في السعر
لماذا Gemini في المقدمة
السبب الرئيسي لفوز Gemini، وفقاً للمؤلف، هو التوازن. لا يحاول النموذج الإعجاب بطول الإجابة، ولا يبسط كل مشهد بشكل مفرط، ولا يفقد الإطار النوعي. في القصة الكوميدية، تجلى هذا في وتيرة أكثر حيوية وفكاهة فعالة، وفي النص العاطفي — في تصعيد واضح من الإنكار إلى الذعر واليأس. بالنسبة لمهام المحتوى، هذا حرج: إذا كتب النموذج بشكل أقصر لكن أكثر دقة، يسهل على المحرر العمل مع النص وقضاء وقت أقل في تنظيفه.
كان للمنافسين نقاط ضعفهم. ChatGPT 5.4، حسب ملاحظة المؤلف، يشير إلى بنية القصة بشكل صريح جداً أحياناً — على سبيل المثال، يركز على نقاط الذروة في الفصول، مما يجعل النص يفقد جودته الطبيعية. Claude Opus 4.6، على العكس من ذلك، يبني الأجواء بشكل جيد، خاصة في القصص عن العزلة والجنون، لكنه يصبح معقداً جداً وتحليلياً أحياناً. هذا لا يكسر الجودة كلياً، لكنه يقلل من الصدمة العاطفية، التي يجب أن تعمل بشكل أسرع في النص الأدبي.
كان الفائز الإجمالي
Gemini 3.1 Pro، على الرغم من أن المشاركين الاثنين الآخرين أظهرا أيضاً نتائج جيدة. يلاحظ المؤلف بشكل منفصل أنه لا يعتبر هذه النتيجة حكماً عاماً على السوق. يعتمد اختيار النموذج دائماً على الذوق والمهمة: بالنسبة للبعض، وضوح ChatGPT والتنبؤية أهم، بالنسبة للآخرين أجواء Claude أقرب. علاوة على ذلك، لتوليد النص الأساسي، برأيه، قد تكون الحلول المجانية مثل DeepSeek كافية. لكن إذا ركزنا بالذات على مزيج الأسلوب والإيجاز ودقة الفئة في هذا الاختبار، فإن قيادة Gemini تبدو مستحقة.
ماذا يعني هذا
بالنسبة للمحررين والكتاب وفريق المحتوى، الاستنتاج عملي جداً: عليك البحث ليس عن النموذج «الأذكى» بشكل عام، بل عن النموذج الذي يتعامل بشكل أفضل مع تنسيق معين. في هذه المقارنة، ثبت أن Gemini 3.1 Pro هو الخيار الأكثر توازناً لمهام النصوص، لكن الفارق بين المشاركين صغير. هذا يعني أنه في العمل الفعلي، يجب اختيار الفائز ليس بالاسم الرنان، بل بعدد التصحيحات التي يجب إجراؤها بعد المسودة الأولى.
هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟
AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.