أطلقت Goodfire أداة Silico لتصحيح أخطاء نماذج اللغة أثناء التدريب
قدّمت Goodfire Silico، وهي أداة تساعد الباحثين على النظر داخل نماذج اللغة والتدخل في سلوكها حتى في مرحلة التدريب. وتعد المنصة ليس فقط بشرح الاستجابات الغريبة…
معالج بواسطة الذكاء الاصطناعي من MIT Technology Review؛ بتحرير Hamidun News
كشفت شركة Goodfire الناشئة عن Silico — أداة تمكّن الباحثين والمهندسين من النظر داخل نماذج اللغة الكبيرة والتدخل في سلوكها أثناء التدريب. الفكرة هي الابتعاد عن نمط "نقوم بالتدريب ونتمنى الأفضل" والحصول على تحكم أكثر دقة فيما يتعلمه النموذج بالفعل.
كيفية عمل Silico
ينتمي Silico إلى مجال قابلية التفسير الآلية — وهي محاولة ليس فقط لتقييم مخرجات النموذج من الخارج، بل لتشريح آلياته الداخلية: أي الميزات وسلاسل التنشيطات ومجموعات الخلايا العصبية تؤثر على مخرجات محددة. تؤكد Goodfire أن نظامها يسمح بالعمل مع النموذج في جميع مراحل التطوير: من اختيار مجموعة البيانات والتحقق منها إلى التدريب الفعلي وتصحيح الأخطاء في السلوك اللاحق. بالنسبة للسوق، هذا تحول مهم، لأن معظم الفرق لا تزال تصلح LLMs بشكل غير مباشر — من خلال بيانات جديدة ونصوص تعليمات وحلقات تدريب لا نهائية.
على موقع Goodfire، يُوصف Silico بأنه بيئة لـ "التصميم المقصود" للنماذج، وليس مجرد أداة تدقيق. يجب أن تساعد المنصة في فهم ما تعلمه النموذج بالفعل، وأين طورت ارتباطات خاطئة، وأي التمثيلات الداخلية تؤدي إلى أعطال. حالياً، يتم توفير الوصول إلى المنتج كوصول مبكر وعند الطلب، مع مناقشة الشروط التجارية على أساس فردي.
- عرض الميزات الداخلية التي تؤثر على مخرج نموذج محدد
- البحث عن الأعطال والأنماط غير المرغوبة قبل النشر في الإنتاج
- تصحيح دقيق للسلوك دون إعادة تدريب كاملة من الصفر
- التحكم في البيانات والميزات والإشارات المكافأة التي تشكل النموذج
ما أظهرته العرض التوضيحي
الجزء الأكثر إثارة للاهتمام في الإعلان ليس وعود مجردة، بل أمثلة محددة لكيفية اقتراح Goodfire "تصحيح أخطاء" LLMs. وفقاً لوصف الشركة، يستخدم Silico وكلاء الذكاء الاصطناعي لأتمتة التفسير، مما يجعل هذه الأساليب في متناول ليس فقط مختبرات البحث على مستوى Anthropic أو DeepMind، بل أيضاً الفرق الأصغر. هذا مهم: ظلت قابلية التفسير الآلية لفترة طويلة مجالاً يوجد فيه الكثير من الأبحاث الجميلة، لكن قليل من الأدوات العملية للمهندسين.
في عروض Goodfire التوضيحية، أظهرت الشركة أنه يمكن تضخيم أو إضعاف الميزات الداخلية المرتبطة بمفاهيم محددة، وبالتالي تغيير سلوك النموذج. تناول أحد الأمثلة التفكير الأخلاقي: تؤكد الشركة أنها تمكنت من تحويل استجابات النموذج من خلال تضخيم الميزات المتعلقة بالشفافية. بدا مثال آخر تقريباً كحكاية طريفة، لكنه يوضح بفعالية الطريقة: عند تحليل خطأ حيث قارن النموذج بشكل غير صحيح 9.
11 و9.9، وجدت Goodfire ميزات داخلية مرتبطة بالمراجع الكتابية واستخدمتها لإصلاح الخلل. تمتلك Goodfire بالفعل قاعدة بحثية تدعم مثل هذه الحالات.
في الأعمال السابقة، أعلنت الشركة عن تقليل الهلوسة بنسبة تصل إلى 58% عند استخدام الميزات الداخلية كإشارات مكافأة أثناء التدريب، وكذلك تقليل السلوك غير المرغوب بشكل ملحوظ من خلال تصفية أمثلة التدريب الإشكالية. يبدو Silico بمثابة محاولة لتجميع هذه الأساليب البحثية في منتج يمكن استخدامه ليس كعرض بحثي، بل في خط أنابيب ML فعلي.
حيث توجد القيود
بغض النظر عن الاهتمام بـ Silico، من المهم عدم الخلط بين عرض توضيحي للإمكانات ومعيار صناعي مثبت بالفعل. تقدم Goodfire نفسها المنتج على أنه وصول مبكر، وليس كمنصة نضجة بالكامل. معظم التأثيرات المزعومة معروفة حالياً فقط من بيانات الشركة وأبحاثها الخاصة.
هذا لا يجعلها غير موثوقة، لكنه يعني أن السوق لا يزال بحاجة إلى التحقق من مدى استقرار هذه الأساليب عبر الهندسات المختلفة والمقاييس والمجالات. هناك أيضاً مشكلة أكثر أساسية: قابلية تفسير النماذج لا تزال بعيدة عن مستوى تصحيح الأخطاء في البرامج العادية. لا تمتلك الشبكة العصبية متغيرات ووظائف مفهومة للبشر، لذلك أي حديث عن "الميزات" و "الخلايا العصبية" و "المفاهيم" يبقى احتمالياً.
حتى لو وجدت أداة ارتباطاً قوياً بين التمثيل الداخلي والخطأ، فإن هذا لا يعني دائماً أن السبب موضعي بالكامل. الخطر هو أن السوق قد يؤمن مبكراً جداً بوهم السيطرة الكاملة على LLMs. لكن هذا هو السبب بالضبط في أن إطلاق Silico مثير للاهتمام.
إذا تمكنت Goodfire فعلاً من نقل قابلية التفسير الآلية من مجال بحث ضيق إلى أداة هندسية عملية، فسيغير هذا عملية تطوير النموذج نفسها. بدلاً من الضبط الخشن على أساس المخرجات، ستحصل الصناعة على القدرة على العمل مع ما يحدث داخل الشبكة، تقريباً كتشخيص النظام لمجموعة برامج معقدة.
ما الذي يعنيه هذا
إذا أثبتت وعود Goodfire صحتها في الممارسة العملية، فسيصبح تطوير LLM أقل شبهاً بصندوق أسود وأقرب إلى الهندسة العادية: مع التشخيص والإصلاحات الموجهة والتدريب الأكثر قابلية للتنبؤ. بالنسبة للشركات التي تبني نماذجها الخاصة أو تدرب نماذج الآخرين، قد يعني هذا عدد أقل من التكرارات العمياء، وعدد أقل من الأعطال غير المتوقعة، ومزيد من التحكم في الجودة والأمان.
هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟
AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.