Habr AI→ المصدر

لماذا ينسى ChatGPT: شرح نافذة السياق في نماذج اللغة

بعد ساعة من المحادثة مع ChatGPT، ينسى النموذج فجأة اسم الشخصية من الرسالة الأولى ويسأل مرة أخرى عما تم الاتفاق عليه بالفعل. هذا ليس خللاً — إنها نافذة…

معالج بواسطة الذكاء الاصطناعي من Habr AI؛ بتحرير Hamidun News
لماذا ينسى ChatGPT: شرح نافذة السياق في نماذج اللغة
المصدر: Habr AI. كولاج: Hamidun News.
◐ استمع للمقال

بعد ساعة من العمل مع ChatGPT، ينسى النموذج فجأة تفاصيل الرسائل الأولى — يناقض نفسه، يسأل مجددًا عما تم الاتفاق عليه بالفعل. هذا ليس عطلًا: هذه هي طريقة عمل نافذة السياق، وفهم هذه الآلية مهم لأي شخص يستخدم الذكاء الاصطناعي في عمله.

ما هي نافذة السياق

نموذج اللغة لا "يتذكر" المحادثة بالمعنى الإنساني. يعالج النص كتكتل واحد — يسمى السياق. نافذة السياق هي الحد الأقصى لحجم النص الذي يمكن للنموذج أن يأخذه في الاعتبار في طلب واحد. وحدة القياس هي الرمز (token): تقريبًا 3–4 أحرف باللغة الإنجليزية أو 1–2 كلمة باللغة الروسية.

تعمل النماذج الحديثة مع نوافذ بسعات مختلفة:

  • GPT-4o — حتى 128,000 رمز (حوالي 96,000 كلمة)
  • Claude 3.7 Sonnet — حتى 200,000 رمز
  • Gemini 1.5 Pro — حتى 2,000,000 رمز
  • Llama 3 — من 8,000 إلى 128,000 رمز حسب النسخة

حتى 128,000 رمز يعادل حوالي 300 صفحة من النص. يبدو أنه الكثير، لكن في جلسات العمل الحقيقية — مع قاعدة الأكواد والمستندات والحوار الطويل — يتم الوصول إلى هذا الحد أسرع مما يبدو.

لماذا يفقد النموذج "الذاكرة"

عندما تتجاوز المحادثة نافذة السياق، لا "ينسى" النموذج — فهو ببساطة لا يرى الرسائل القديمة. إنها غائبة تقنيًا عن بيانات إدخال الطلب.

تحل معظم الخدمات هذه المشكلة بإحدى طريقتين.

القطع: تُحذف الرسائل الأقدم من السياق. يستمر النموذج في الرد، لكن بدون إمكانية الوصول إلى بداية المحادثة. هذه هي الطريقة التي تعمل بها معظم واجهات الدردشة بشكل افتراضي.

التلخيص: بدلاً من الرسائل الـ N الأولى، يتم توفير ملخص موجز معها — تم إنشاؤه بواسطة النموذج نفسه — في السياق. تُفقد التفاصيل، لكن الخط العام يُحافظ عليه.

هناك أيضًا نهج ثالث — RAG (Retrieval-Augmented Generation): تُخزن المعلومات المهمة في قاعدة بيانات خارجية وتُحمّل في السياق فقط عند الحاجة. هذه هي طريقة عمل أنظمة الذكاء الاصطناعي الأكثر تعقيدًا والحلول الموجهة للمؤسسات.

الفقدان في المنتصف: مشكلة مخفية

المشكلة ليست فقط حول امتلاء السياق. تتدهور جودة الإجابات حتى قبل انتهاء السياق. وصف باحثون من Stanford و Berkeley في عام 2023 ظاهرة "الفقدان في المنتصف" (lost in the middle): تستخدم النماذج معلومات من بداية ونهاية السياق بشكل أفضل بكثير. البيانات التي تقع في المنتصف تُعالج بشكل أسوأ — يبدو أن النموذج "لا يلاحظها".

"تميل نماذج اللغة إلى استخدام المعلومات ذات الصلة بشكل أسوأ عندما تكون موجودة في منتصف سياق طويل"، — من دراسة

Lost in the Middle، 2023.

الاستنتاج العملي: من الأفضل إعطاء التعليمات الرئيسية في البداية أو في نهاية الطلب، بدلاً من دفنها في منتصف مستند طويل.

كيفية العمل مع هذا القيد

عدة استراتيجيات عملية:

  • قسّم المهام — بدلاً من جلسة واحدة ضخمة، قسّم العمل إلى جلسات مع ملخصات وسيطة واضحة
  • ضع المعلومات المهمة في البداية — يعمل الطلب النظامي والقيود الرئيسية بشكل أفضل في بداية السياق
  • استخدم نماذج بنوافذ أكبر — للمستندات الكبيرة، اختر Gemini 1.5 Pro (2M رمز) أو Claude مع 200K
  • لخّص بنفسك — قبل جلسة جديدة، اطلب من النموذج تلخيص الجلسة السابقة واحفظ هذا النص
  • قدّر الطول مسبقًا — 1 صفحة من النص ≈ 500 رمز، 1 ملف أكواد ≈ 1,000–5,000 رمز

ماذا يعني هذا

نافذة السياق ليست تفصيلة تقنية، بل معامل مركزي لأي عمل مع نماذج اللغة. يتيح فهم هذا القيد لك عدم نسب السلوك "الغريب" للنموذج إلى عطل، بل تنظيم جلسات عملك بشكل صحيح. استمر التسابق من أجل سياق أكبر: يتنافس المزودون على زيادة الحدود، لكن سؤال الهندسة "ما الذي يراه النموذج الآن" سيبقى مفتاحًا لفترة طويلة قادمة.

ZK
Hamidun News
أخبار الذكاء الاصطناعي بدون ضوضاء. اختيار تحريري يومي من أكثر من 400 مصدر. منتج من جمال حميدون، رئيس الذكاء الاصطناعي في Alpina Digital.

هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟

AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.

ما رأيك؟
جارٍ تحميل التعليقات…