Hugging Face Blog→ المصدر

كشفت Nvidia عن أول مجموعة بيانات مفتوحة ونماذج AI تأسيسية للروبوتات الطبية

نشرت Nvidia وشركاؤها Open-H-Embodiment، أول مجموعة بيانات مفتوحة كبيرة للروبوتات الطبية. وتضم 778 ساعة من البيانات عن الجراحة والموجات فوق الصوتية وتنظير…

معالج بواسطة الذكاء الاصطناعي من Hugging Face Blog؛ بتحرير Hamidun News
كشفت Nvidia عن أول مجموعة بيانات مفتوحة ونماذج AI تأسيسية للروبوتات الطبية
المصدر: Hugging Face Blog. كولاج: Hamidun News.
◐ استمع للمقال

قدمت نفيديا أول مجموعة بيانات مفتوحة وأساسية نماذج ذكاء اصطناعي للروبوتات الطبية الجراحية

قدمت نفيديا، بالتعاون مع المجتمع البحثي، Open-H-Embodiment — أول مجموعة بيانات مفتوحة كبرى لتطبيقات الروبوتات الطبية، إلى جانب نموذجين أساسيين للسيناريوهات الجراحية. تم نشر الحزمة على Hugging Face وتهدف إلى تحويل الذكاء الاصطناعي الطبي من تحليل الصور نحو أنظمة قادرة على التصرف في العالم الفيزيائي.

ما تم فتحه

الفكرة الأساسية من هذا الإطلاق بسيطة: بالنسبة للطب، لم تعد النماذج التي تتعرف فقط على الصور أو تقسم الأنسجة أو تصنف الأمراض كافية. في غرفة العمليات أو أثناء الموجات فوق الصوتية أو التنظير القولوني، يجب على الآلة أن تعمل مع الأدوات وتفهم الاتصال بالأنسجة وتأخذ في الاعتبار حركيات الروبوت وتغلق حلقة التحكم مع التغذية الراجعة. تم تجميع Open-H-Embodiment تماماً لهذا الغرض — أساس مشترك لتدريب وتقييم Physical AI في الروبوتات الطبية.

  • 778 ساعة من بيانات التدريب بموجب ترخيص CC-BY-4.0
  • 35 منظمة مشاركة من الجامعات والعيادات والصناعة
  • سيناريوهات من الجراحة والموجات فوق الصوتية والتنظير القولوني المستقل
  • بيانات من المحاكاة والتمارين التدريبية والإجراءات الحقيقية
  • الدعم لمنصات الروبوتات التجارية والبحثية

بالنسبة للسوق، الحجم مهم، لكن الصيغة مهمة أيضاً. تجمع مجموعة البيانات بين الرؤية والقوة والحركيات والأنواع المختلفة من الأجسام الروبوتية في مجموعة مفتوحة واحدة، حتى تتمكن الفرق من مقارنة الأساليب على أساس مشترك بدلاً من المجموعات المحلية المغلقة. يشمل المشروع نفيديا و Johns Hopkins و Technical University of Munich و Stanford وعشرات الفرق الأخرى، لذا هذا ليس نشراً لمرة واحدة بل محاولة لتحديد معيار صناعي.

كيفية عمل النماذج

جنباً إلى جنب مع مجموعة البيانات، أطلقت نفيديا GR00T-H — نموذج Vision-Language-Action للروبوتات الجراحية، مدرب على حوالي 600 ساعة من بيانات Open-H-Embodiment. هذا في الأساس نموذج سياسة يستقبل سياقاً بصرياً ونصياً ويترجمه إلى إجراءات الروبوت. يؤكد المؤلفون أنهم قدموا فضاء إجراء معياري مشترك للروبوتات المختلفة وإسقاطات متخصصة للحركيات المحددة والتدريب على الحركات النسبية للأدوات. أظهر النموذج الأولي بالفعل إكمال الغرزة الكاملة في معيار SutureBot، مما يعني أننا نتحدث ليس عن حركة قصيرة بل عن سلسلة طويلة من الإجراءات الدقيقة.

الجزء الثاني من المكدس هو Cosmos-H-Surgical-Simulator، نموذج أساسي عالمي لمحاكاة جراحية مشروطة بالإجراءات. تم ضبطه على Open-H-Embodiment بحيث ينتج النموذج فيديو جراحي واقعي مباشرة من إجراءات حركيات الروبوت، بما في ذلك التأثيرات المعقدة مثل تشوه الأنسجة الرخوة والوهج والدم والدخان. الفائدة العملية ملحوظة: 600 تشغيل في مثل هذا المحاكي يستغرق حوالي 40 دقيقة مقابل حوالي يومين من الاختبارات الحقيقية على المقاعس. استخدموا 64 GPU A100 وحوالي 10 آلاف ساعة GPU للضبط الدقيق، لذا هذا بالفعل إعداد بنية تحتية جادة، وليس عرض توضيحي في المختبر.

ما يأتي بعد ذلك

الجزء الأكثر إثارة للاهتمام في هذه القصة هو محاولة تحويل الروبوتات الطبية من وضع "النموذج يرى" إلى وضع "النموذج يعمل ويعمم". مجموعة بيانات مفتوحة بالإضافة إلى نموذجين أساسيين تمنح الباحثين مكداساً مشتركاً لتجارب محاكاة-إلى-واقع وتوليد البيانات الاصطناعية ونقل المهارات بين الروبوتات المختلفة. هذا مهم بشكل خاص للجراحة، حيث يكون جمع مجموعات البيانات الكبيرة والعالية الجودة مكلفاً وخطأ التحكم يكلف أكثر بكثير من رؤية الكمبيوتر العادية.

"تحتاج الروبوتات الجراحية إلى لحظتها

ChatGPT الخاصة". هكذا يصف المؤلفون الهدف من الإصدار الثاني من Open-H-Embodiment. المرحلة التالية ليست مجرد تحكم أفضل بالأدوات، بل الاستقلالية مع عناصر الاستدلال: يجب أن تكون الأنظمة قادرة على شرح الخطوات وتخطيط الإجراءات الطويلة والتكيف مع الأعطال والتعلم من المسارات المشروحة مع الإشارة إلى النوايا والنتائج وأنواع الأخطاء. إذا جمعت المجتمع فعلاً بيانات جاهزة للاستدلال، فقد تحصل الطب ليس على خوارزمية ضيقة أخرى، بل على منصة لمساعدين روبوتيين أكثر عمومية.

ما يعنيه

بالنسبة لسوق الذكاء الاصطناعي، هذا تحول مهم: في الطب، يبدأون بجمع نماذج ليست مجرد الاعتراف، بل طبقة أساسية لـ Physical AI، حيث يتم إطلاق البيانات ونماذج السياسة والمحاكيات كحزمة. إذا نجح هذا النهج، سيحصل رجال الأعمال والمختبرات ومصنعو الروبوتات على مجموعة بداية مشتركة لتسريع البحث وتقليل تكاليف الاختبار والانتقال الأسرع من الأنماط الأولية إلى الأنظمة المفيدة سريرياً.

ZK
Hamidun News
أخبار الذكاء الاصطناعي بدون ضوضاء. اختيار تحريري يومي من أكثر من 400 مصدر. منتج من جمال حميدون، رئيس الذكاء الاصطناعي في Alpina Digital.

هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟

AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.

ما رأيك؟
جارٍ تحميل التعليقات…