«ريرايت-زافود» أظهر حدود إعادة الصياغة بـAI: يمكن نقل القواعد، لكن لا يمكن نقل الصوت التحريري
شرح فريق «ريرايت-زافود» لماذا يمكن لإعادة صياغة الأخبار بـAI أن تكون دقيقة من حيث الوقائع وصحيحة من حيث البنية، لكنها مع ذلك لا تبدو كأنها صادرة عن وسيلة…
معالج بواسطة الذكاء الاصطناعي من Habr AI؛ بتحرير Hamidun News
وصفت فرقة مشروع "مصنع إعادة الصياغة"، الذي يؤتمتة إعادة صياغة الأخبار للوسائط الإقليمية، القيد الرئيسي لنهجها: تستطيع الذكاء الاصطناعي بالفعل إعادة إنتاج هيكل النص والقواعد التحريرية الرسمية، لكنها لا تستوعب دائماً صوت منشور معين. باستخدام أمثلة من مواد فونتانكا، أظهر المطورون أن العامل الحاسم ليس القالب، بل الاختيار الدقيق للكلمات.
الاختبار على فونتانكا
دربت فرقة التطوير النظام على أسلوب فونتانكا ومررت عدة نصوص عن نفس الحدث — اعتقال مراهق يبلغ من العمر 16 عاماً في أوفا يشتبه في تحضيره لهجوم إرهابي. اتضحت إعادة الصياغة المولدة صحيحة نحوياً، منطقية ودقيقة من الناحية الواقعية: تم تجميع الفقرة الافتتاحية بشكل صحيح، كانت الإسناد في مكانه، لم تُفقد التفاصيل الرئيسية. لكن بجوار النص الفعلي لفونتانكا، أصبح من الواضح بسرعة أن النموذج يكتب مثل خبر عام، وليس مثل منشور معين.
انحصرت الفروقات الرئيسية في كلمة واحدة. تضمن الأصل كلمة "подросток" (مراهق)، بينما في منشور فونتانكا استُخدمت كلمة "мальчик" (صبي) و"школьник" (طالب مدرسة). هذا الاختيار لا يغير المحتوى الواقعي للخبر، لكنه يغير نبرته: إلى جانب ذكر التجنيد والإرهاب، يظهر صورة طفلية تزيد من التوتر دون حكم مباشر من المؤلف.
يوصل المصطلح المحايد الحقيقة، بينما الكلمة التحريرية الأكثر دقة توصل أيضاً البعد المؤلف والإيقاع والوزن العاطفي للعبارة.
"صبي" بدلاً من "مراهق" — هذا هو الحدس التحريري.
حيث تنهار القواعد
يستخدم المشروع نهجاً قائماً على الجوانب للأسلوب: بدلاً من مطالبة واحدة كبيرة، يتلقى النموذج مجموعة من خصائص وسيط معين — الهيكل والنبرة والمفردات والعناوين والمعاملات الأخرى. يعمل هذا النهج بشكل جيد حيث يمكن وصف الأسلوب كقاعدة. على سبيل المثال، يمكن تحديد أن الفقرة الافتتاحية تبدأ بحقيقة، والإسناد يُعطى مرة واحدة، والجمل قصيرة في المتوسط، والاسم الجغرافي الرسمي "سانت بطرسبرغ" من الأفضل استبداله بـ "بطرسبرغ".
كل هذا يمكن قياسه والتحقق منه وإعادة إنتاجه بثبات معقول على نصوص جديدة. تبدأ المشكلة حيث لا يتألف الأسلوب من المحظورات والتعليمات، بل من الاختيارات الدقيقة في سياق معين. صيغة مثل "نبرة محايدة-إعلامية مع عناصر من الحوارية" تبدو معقولة، لكنها تقول القليل جداً عن الكلمة الدقيقة التي سيختارها المحرر في قصة حساسة.
ينطبق الأمر نفسه على الصيغة "وفقاً للتحقيق": فهي ليست مجرد مصدر، بل طريقة لتضمين المسافة في العبارة نفسها. لا تختزل مثل هذه القرارات إلى مجموعة مستقرة من القواعد، لأن المنشور نفسه قد يكتب بطريقة أكثر جفافاً في حالة أخرى.
ما الذي يصلحونه بعد ذلك
لا يعتبر المطورون هذا خللاً بالمعنى الضيق. بالأحرى، يتعلق الأمر بحدود الطريقة نفسها: يتم نقل الهيكل من خلال التعليمات، بينما يتم نقل الصوت عادة من خلال الأمثلة. لهذا السبب يقوي المنتج الآن ليس القواعد المجردة، بل السياق المحيط بالتوليد. المنطق بسيط: ينسخ النموذج بشكل أفضل أسلوباً تحريرياً لاحظه بدلاً من أن يتبع وصفاً لفظياً لنبرة دقيقة لا يمكن رسميتها بشكل موثوق لجميع الحالات. في الممارسة العملية، هذا يحول تركيز العمل من المطالبة إلى اختيار الأمثلة ذات الصلة.
- يزداد عدد الأمثلة المراد محاكاتها من 3 إلى 10–15.
- يتم اختيار الأمثلة حسب نوع القصة: الجريمة بالجريمة، الطوارئ بالطوارئ.
- يتم فحص النموذج بشكل إضافي للتوافق مع المحظورات الصريحة من دليل الأسلوب.
- يتحقق الوكيل ليس فقط من دقة الحقائق بل أيضاً من اكتمال نقل الحقائق في إعادة الصياغة.
بالموازاة مع ذلك، تقوم الفريق بتحسين تحديد موضع MVP: يجب أن يعيد النظام إنتاج الهيكل والسمات الرسمية للأسلوب بدقة، بينما الصوت تقريبي فقط. هذا إطار أكثر صراحة لغرف الأخبار التي تحتاج إلى إعادة صياغة سريعة وقابلة للعمل دون وعود بعدم التمييز الكامل عن مؤلف حي. وفقاً لتقييم الفريق، قد تكون هذه كافية بالفعل لمعظم وسائط الإعلام الإقليمية، لأن الاختلافات في الأسلوب عادة ما تكون أضعف من تلك الموجودة في فونتانكا. بعبارة أخرى، يعد المنتج بانضباط النص والسرعة، وليس سحر المحاذاة الكاملة مع منشور معين.
ما يعنيه هذا
تروي قصة "صبي" مقابل "مراهق" حداً مهماً لأدوات الذكاء الاصطناعي التحريرية. إنها قادرة بالفعل على توفير الوقت في العمل الروتيني وتكرار شكل النص بدقة معقولة، لكن القرارات الدقيقة للنبرة تظل حتى الآن منطقة من التحرير البشري. بالنسبة لمنتجات الأخبار، هذا يعني شيئاً بسيطاً: تعمل إعادة الصياغة الآلية إذا وعدت بالسرعة وانضباط النص، وليس إعادة الإنتاج الكاملة لصوت وسيط معين. على هذا التمايز يجب الآن بناء التوقعات الواقعية لأتمتة غرفة الأخبار.
هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟
AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.