Habr AI→ المصدر

التعبيرات النمطية من نموذج اللغة المحلي: تجربة Bitrix24 بدون إعادة تدريب

في عالم حديث حيث تنمو أحجام البيانات بشكل أسي، أصبح تحليل السجلات الفعال أمراً حاسماً للحفاظ على استقرار وأمان البنية التحتية لتكنولوجيا المعلومات. وجدت…

معالج بواسطة الذكاء الاصطناعي من Habr AI؛ بتحرير Hamidun News
التعبيرات النمطية من نموذج اللغة المحلي: تجربة Bitrix24 بدون إعادة تدريب
المصدر: Habr AI. كولاج: Hamidun News.
◐ استمع للمقال

في عالم حديث حيث تنمو أحجام البيانات بشكل أسي، أصبح تحليل السجلات الفعال أمراً حاسماً للحفاظ على استقرار وأمان البنية التحتية لتكنولوجيا المعلومات. وجدت Bitrix24 حلاً مبتكراً لهذا التحدي باستخدام نموذج لغة محلي (LLM) لتوليد التعبيرات النمطية (Regex) تلقائياً. بدلاً من النهج التقليدي الذي يتطلب إعادة تدريب مكلفة وشاقة للشبكات العصبية على البيانات الملكية، طورت Bitrix24 نظاماً حيث يقوم LLM بتوليد Regex، بينما يقوم البرنامج النصي بحفظ وتطبيق هذه القواعد بشكل مستقل. لا يوفر هذا النهج الموارد فحسب، بل يضمن أيضاً أمان البيانات، حيث تحدث جميع الحسابات داخل محيط الشركة.

تقليدياً، فإن إنشاء Regex لتحليل السجلات هو مهمة روتينية وشاقة تتطلب معرفة عميقة بصيغة التعبيرات النمطية وفهم هيكل السجلات. يمكن أن تستغرق هذه العملية مئات الساعات من تصحيح الأخطاء اليدوي، خاصة عند العمل مع كميات كبيرة من ملفات السجلات المتنوعة. يمكن لاستخدام واجهات برمجة التطبيقات السحابية لتوليد Regex تبسيط هذه المهمة، لكنها تأتي مع مخاطر مرتبطة بنقل البيانات السرية إلى خدمات الجهات الخارجية. علاوة على ذلك، قد تثبت الحلول السحابية عدم جدواها اقتصادياً عند التعامل مع أحجام كبيرة من البيانات المعالجة.

تتضمن بنية النظام الذي طورته Bitrix24 نموذج لغة محلي يعمل على Mac Mini. يتلقى النموذج وصفاً لهيكل السجل وعملية تحليل، وبعد ذلك يولد التعبير النمطي المقابل. ينقذ البرنامج النصي الذي طوره متخصصو Bitrix24 تلقائياً Regex المولدة ويستخدمه لتحليل السجلات. النقطة الأساسية هي أن LLM يتم استخدامه جاهزاً للاستخدام، دون إعادة تدريب إضافية على بيانات محددة في Bitrix24. بدلاً من ذلك، يتم التركيز على تحسين البرنامج النصي الذي يدير عملية توليد وتطبيق Regex.

مزايا هذا النهج واضحة. أولاً، توفير الموارد: عدم الحاجة لإعادة تدريب الشبكة العصبية يقلل بشكل كبير من تكاليف القوة الحسابية وصيانة مجموعة البيانات. ثانياً، أمان محسّن: تحدث جميع الحسابات داخل الشركة، مما يلغي خطر تسرب البيانات السرية. ثالثاً، المرونة وقابلية التوسع: يتكيف النظام بسهولة مع أنواع السجلات الجديدة ويمكن توسيع نطاقه للتعامل مع أحجام بيانات كبيرة.

سمحت عملية تنفيذ هذا النظام لـ Bitrix24 بتقليل الوقت المنفق على تحليل السجلات بشكل كبير وتحسين كفاءة متخصصي تكنولوجيا المعلومات. يحرر التوليد التلقائي لـ Regex الموارد لحل المهام الأكثر تعقيداً مثل تحليل الشذوذ وكشف تهديدات الأمان. توضح هذه الحالة أن LLMs المحلية يمكن أن تكون أداة فعالة لحل المهام العملية التي لا تتطلب إعادة تدريب معقدة.

لهذا النهج آفاق واسعة للشركات الأخرى التي تواجه الحاجة لتحليل أحجام كبيرة من البيانات. يمكن تطبيقه في مجالات مختلفة مثل مراقبة أداء التطبيقات والكشف عن الاحتيال وتحليل سلوك المستخدم. من المهم الإشارة إلى أن نجاح هذا النهج يعتمد إلى حد كبير على جودة البرنامج النصي الذي يدير عملية توليد وتطبيق Regex. لذلك، يجب على الشركات التي تخطط لتنفيذ نظام كهذا أن تولي اهتماماً خاصاً لتطوير وتحسين هذا البرنامج النصي.

في الختام، أثبتت Bitrix24 نهجاً مبتكراً في استخدام LLMs المحلية لأتمتة إنشاء Regex. لا يوفر هذا النهج الموارد ويعزز أمان البيانات فحسب، بل يفتح أيضاً آفاقاً جديدة لحل مهام تحليل البيانات العملية. في المستقبل، يمكننا أن نتوقع تطويراً إضافياً في هذا الاتجاه وظهور أدوات وطرق جديدة تستخدم LLMs المحلية لأتمتة مهام مختلفة.

ZK
Hamidun News
أخبار الذكاء الاصطناعي بدون ضوضاء. اختيار تحريري يومي من أكثر من 400 مصدر. منتج من جمال حميدون، رئيس الذكاء الاصطناعي في Alpina Digital.

هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟

AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.

ما رأيك؟
جارٍ تحميل التعليقات…