MarkTechPost→ المصدر

أطلقت Meta FAIR حزمة NeuralSet — حزمة Python لربط البيانات العصبية ونماذج الذكاء الاصطناعي

قدمت Meta FAIR حزمة NeuralSet — حزمة Python مفتوحة المصدر لـ Neuro-AI تجمع البيانات العصبية وتضمينات النماذج الحديثة في خط أنابيب PyTorch واحد. تعمل الأداة…

معالج بواسطة الذكاء الاصطناعي من MarkTechPost؛ بتحرير Hamidun News
أطلقت Meta FAIR حزمة NeuralSet — حزمة Python لربط البيانات العصبية ونماذج الذكاء الاصطناعي
المصدر: MarkTechPost. كولاج: Hamidun News.
◐ استمع للمقال

أطلقت Meta FAIR مكتبة NeuralSet — حزمة بايثون لـ Neuro-AI تجمع بيانات عصبية وتحفيزات تجريبية وتضمينات من نماذج حديثة في خط أنابيب واحد. يهدف المشروع إلى القضاء على التكامل اليدوي بين أدوات العلوم العصبية وكومة التعلم العميق، التي كانت تبطئ الأبحاث على نطاق واسع.

ما المشكلة؟

تمتلك العلوم العصبية بالفعل أدوات متخصصة قوية مثل MNE-Python و Nilearn و EEGLAB و FieldTrip و fMRIPrep. لكن الكثير من هذه الكومة تم بناؤه قبل طفرة التعلم العميق وتم تصميمه للسيناريوهات التي يتم فيها تحميل البيانات بالكامل في الذاكرة ومعالجة الأنماط بشكل منفصل. بالنسبة لمهام Neuro-AI الحديثة، لم يعد هذا كافياً: يحتاج الباحثون إلى ربط إشارات الدماغ ليس فقط مع بعضهم البعض، بل أيضاً مع النصوص والصوت والصور والفيديوهات التي تمر عبر نماذج من نظام Hugging Face البيئي.

نتيجة لذلك، غالباً ما تقوم المختبرات بتجميع خطوط أنابيب محلية الصنع: تنظف fMRI أو EEG بشكل منفصل، وتحسب التضمينات للكلمات والإطارات أو الأصوات بشكل منفصل، ثم تقوم بمزامنة كل شيء يدوياً عبر الزمن، وتقوم بتكوين التخزين المؤقت وإعادة كتابة البنية التحتية لكل تجربة جديدة. عند التعامل مع مجموعات بيانات عامة بحجم تيرابايت والمحفزات المستمرة مثل الكلام أو الفيديو، يصبح هذا النهج ليس مجرد غير مريح بل يبطئ الأبحاث بشكل حقيقي.

كيف يعمل NeuralSet

الفكرة الأساسية لـ NeuralSet هي فصل هيكل التجربة عن استخراج البيانات الثقيل. أولاً، تصف الحزمة كل ما يحدث كأحداث خفيفة الوزن مع نوع ووقت البدء والمدة والمقياس الزمني المشترك. يتم جمع هذه الأحداث في كائن دراسة واحد بناءً على pandas DataFrame، بحيث يمكن للباحثين تصفية وتجميع وإعادة تجميع مجموعات البيانات الكبيرة دون تحميل الإشارات الخام في الذاكرة العشوائية. هذا النهج متوافق مع مجموعات بيانات BIDS، التي أصبحت بالفعل معياراً في أجزاء من أبحاث العلوم العصبية.

  • يدعم fMRI و EEG و MEG و iEEG و fNIRS و EMG والارتفاعات
  • التكامل مع النص والصوت والصور والفيديو
  • يمكن الحصول على التضمينات من نماذج Hugging Face، بما في ذلك CLIP و DINOv2 و Whisper و Wav2Vec و GPT-2 و LLaMA
  • يمكن نشر التمثيلات الثابتة في سلاسل زمنية للمزامنة مع الإشارات العصبية

بعد ذلك تأتي مكونات Extractor. بالنسبة للبيانات العصبية، يستخدمون مكتبات مثبتة لغرضها المقصود: على سبيل المثال، يعتمد FmriExtractor على Nilearn، بينما يستخدم MegExtractor و EegExtractor MNE-Python. بالنسبة للمحفزات، تبني الحزمة التضمينات من النماذج الحديثة وتحضرها إلى تنسيق زمني موحد. المخرجات عبارة عن Dataset و DataLoader قياسي متوافق مع PyTorch يمكن توصيله مباشرة بتدريب النماذج دون إعادة كتابة خط الأنابيب لكل طريقة.

التوسع بدون ألم

تركز Meta FAIR على الاستنساخية والبنية التحتية. يستخدم NeuralSet نظام استخراج بثلاث مراحل: أولاً يتم التحقق من الحدود القصوى، ثم يتم تحضير العمليات الحسابية الثقيلة مسبقاً وتخزينها مؤقتاً، وأثناء التدريب يتم سحب البيانات بكسل من ذاكرة التخزين المؤقت. هذا مهم للعمليات المكلفة مثل تشغيل محرك لغة كبير أو متعدد الأنماط عبر كل corpus: يمكن إعادة استخدام التمثيلات المحسوبة مرة واحدة في التجارب الجديدة. تستخدم الحزمة أيضاً Pydantic للتحقق الصارم من التكوين وواجهة خلفية قائمة على Dask للتخزين المؤقت الحتمي وتتبع نسب الحسابات. إذا تم تعيين معامل بشكل غير صحيح، فإن الخطأ يظهر على الفور بدلاً من بعد ساعات من الحسابات. يمكن تشغيل الكود نفسه أولاً محلياً على موضوع واحد، ثم التبديل إلى مجموعة SLURM بمجرد تغيير تكوين واحد.

في الورقة البحثية والتوثيق، يؤكد المؤلفون بشكل خاص على أن NeuralSet لا يحل محل MNE-Python أو Nilearn، بل يعمل كطبقة تنسيق بين أدوات neuro الناضجة و PyTorch. في المقارنة من الورقة، أثبت الحزمة أنها الحل الوحيد الذي يتمتع بدعم كامل في جميع الفئات المختبرة — من أجهزة التسجيل إلى قدرات البنية التحتية.

ما معنى هذا

NeuralSet ليس نموذجاً آخر، بل طبقة بنية تحتية يمكن أن تسرع بشكل كبير فئة كاملة من مشاريع Neuro-AI. إذا بسطت الحزمة بالفعل العمل مع البيانات العصبية متعددة الأنماط والتضمينات من النماذج الحديثة، فسيكون لدى الباحثين هندسة يدوية أقل وفرصة أفضل لتجميع التجارب القابلة للاستنساخ بسرعة على نطاق واسع.

ZK
Hamidun News
أخبار الذكاء الاصطناعي بدون ضوضاء. اختيار تحريري يومي من أكثر من 400 مصدر. منتج من جمال حميدون، رئيس الذكاء الاصطناعي في Alpina Digital.

هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟

AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.

ما رأيك؟
جارٍ تحميل التعليقات…