36Kr (36氪)→ المصدر

تم تكييف MinerU للعمل على 10 نماذج من شرائح AI الصينية

أعلن فريق OpenDataLab في Shanghai AI Laboratory إكمال تكييف عميق لأداة MinerU للعمل على أكثر من 10 منصات حوسبة صينية، بما في ذلك شرائح Ascend وT-Head وMetax…

معالج بواسطة الذكاء الاصطناعي من 36Kr (36氪)؛ بتحرير Hamidun News
تم تكييف MinerU للعمل على 10 نماذج من شرائح AI الصينية
المصدر: 36Kr (36氪). كولاج: Hamidun News.
◐ استمع للمقال

# تم تكييف MinerU للعمل على 10 نماذج من رقاقات الذكاء الاصطناعي الصينية: لماذا هذا بالغ الأهمية لاستقلالية سلسلة التوريد التكنولوجية

حصل مطورو الذكاء الاصطناعي الصينيون على أداة طالما انتظروها للتغلب على الاعتماد على المعدات الغربية. أعلن فريق OpenDataLab من مختبر شنغهاي للذكاء الاصطناعي، بالتعاون مع شركة DeepLink وعدة من مصنعي الرقاقات المحلية، عن انتهاء تكييف MinerU — وهو محلل وثائق عالي الدقة — للعمل على أكثر من 10 منصات حوسبة مختلفة من الإنتاج المحلي. تشمل هذه معماريات Ascend و T-Head و Metax. يسلط هذا العمل الضوء على الجهود الواسعة النطاق للمنطقة لتقليل الاعتماد التكنولوجي وبناء نظام بيئي للابتكار خاص بها.

MinerU ليس مجرد أداة معالجة نصوص أخرى. إنه نظام متخصص يحول ملفات PDF المعقدة وصفحات الويب والصيغ الرياضية والجداول المعقدة إلى بيانات منظمة يمكن لنماذج اللغة الكبيرة معالجتها بشكل صحيح. تصل دقة التحويل إلى 99%، وهو أمر بالغ الأهمية لأن جودة بيانات التدريب تؤثر مباشرة على قدرات النموذج الناتج. في الواقع، يحل MinerU مشكلة كانت بمثابة اختناق لفترة طويلة في تحضير البيانات للذكاء الاصطناعي: كيفية استخراج المعنى من ملايين الوثائق غير المنظمة المخزنة في الأرشيفات الشركاتية والسجلات الحكومية.

المشكلة موجودة ليس فقط في النظرية. عندما تحاول الشركات والمؤسسات الحكومية رقمنة أرشيفاتها أو تحضير مجموعات بيانات لتدريب النماذج، فإنها تواجه انهمار ملفات PDF والمستندات الممسوحة ضوئياً والجداول التي يجب تحويلها إلى صيغة قابلة للقراءة الآلية. القيام بذلك يدويًا مستحيل، والحلول القائمة غالباً ما تفقد السياق أو تشوه الصيغ أو تسيء تفسير العناصر البصرية. يحل MinerU هذه المهمة بدقة قريبة من الكمال، مما يسمح للمنظمات بتوفير أشهر من العمل والموارد البشرية.

لكن ما هي الأهمية الحقيقية لهذا الخبر؟ يعني تكييف MinerU لأكثر من 10 منصات رقاقات محلية أن مطوري البرمجيات الصينيين يمكنهم الآن بناء دورة إنتاج ذكاء اصطناعي كاملة دون اللجوء إلى المكونات الأمريكية والأوروبية. ينطبق هذا على جميع المراحل: من جمع البيانات وتحضيرها إلى تدريب النماذج. عندما تعمل البنية التحتية على رقاقات محلية — سواء كانت Ascend من Huawei أو T-Head من Alibaba — تبقى سلسلة خلق القيمة بأكملها في الدولة.

السياق الجيوسياسي هنا أمر لا مفر منه. أدت التوترات بين الغرب والصين إلى فرض عقوبات على صادرات أشباه الموصلات المتقدمة، مما أجبر المنطقة على الاستثمار في تطويرها الخاص. اختارت OpenDataLab هذه اللحظة بالذات لإكمال تكييف MinerU، مما يشير إلى أن القاعدة التكنولوجية المحلية متطورة بما يكفي لإطلاق مشاريع هندسية معقدة. هذا ليس مجرد نجاح تقني — إنه بمثابة عرض لحالة صناعة الذكاء الاصطناعي المحلية.

بالنسبة للمستخدمين في السوق العالمية، يعني هذا ظهور مصدر بديل للبيانات والأدوات لمعالجة الوثائق. بالنسبة للشركات الصينية والهيئات الحكومية، يفتح هذا إمكانية توسيع مشاريع الذكاء الاصطناعي الخاصة بهم دون قيود المعدات. وعلى الرغم من أن التكييف لا يغير التكنولوجيا نفسها، إلا أنه يغير اقتصاديات تطبيقها: الآن يمكن العمل مع MinerU بشكل أرخص وبدون القلق بشأن تأثير العقوبات على سلسلة التوريد.

ZK
Hamidun News
أخبار الذكاء الاصطناعي بدون ضوضاء. اختيار تحريري يومي من أكثر من 400 مصدر. منتج من جمال حميدون، رئيس الذكاء الاصطناعي في Alpina Digital.

هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟

AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.

ما رأيك؟
جارٍ تحميل التعليقات…