Mistral AI News→ المصدر

أطلقت Mistral OCR 4: bounding boxes، و170 لغة، ونشر self-hosted

أطلقت Mistral AI OCR 4 — وهو محرك من الجيل الجديد للتعرف على المستندات. يعيد النموذج الآن ليس النص فقط، بل أيضًا إحداثيات كل كتلة (bounding boxes)، وأنواعها…

معالج بواسطة الذكاء الاصطناعي من Mistral AI News؛ بتحرير Hamidun News
أطلقت Mistral OCR 4: bounding boxes، و170 لغة، ونشر self-hosted
المصدر: Mistral AI News. كولاج: Hamidun News.
◐ استمع للمقال

أطلقت Mistral AI نسخة OCR 4 — محرك معالجة ذكية للمستندات الإدارية. على عكس أسلافه، يرجع النموذج ليس النص المستخرج فحسب، بل خريطة منظمة كاملة للمستند: إحداثيات الكتل وأنواعها ودرجات الثقة لكل كلمة.

ما الذي تغير في النسخة الرابعة

الابتكار الأكثر طلباً هو bounding boxes: يتلقى كل كتلة نص الآن إحداثيات دقيقة على الصفحة. هذا يسمح للأنظمة الموضوعية بتسليط الضوء على المصادر المقتبسة مباشرة في الواجهة، وبناء خطوط أنابيب بيانات موثوقة، وتنفيذ التحقق برمجي تحت الإشراف البشري للمستندات الحساسة. في السابق، كانت معظم حلول OCR تُرجع نصاً "مسطحاً" بدون ربط بموضع الصفحة.

بالإضافة إلى الإحداثيات، تصنف OCR 4 كل كتلة حسب النوع: عنوان رئيسي، عنوان فرعي، فقرة، جدول، معادلة، تسمية توضيحية للصورة. مقترنة بدرجات الثقة المضمنة — على مستوى الصفحة ولكل كلمة فردية — يفتح هذا سيناريوهات جديدة بشكل أساسي: الاستشهاد مع نسب مصدر دقيق، التحرير التلقائي للبيانات السرية، التحقق الموجه من العامل من النتائج.

تستفيد خطوط أنابيب RAG بشكل خاص ملحوظ: تصبح الكتل المصنفة وحدات استرجاع عالية الجودة، ويحصل الوكلاء على القدرة ليس فقط على قراءة المستندات، بل التصرف بناءً عليها — ملء النماذج، معالجة الفواتير، تنفيذ فحوصات الامتثال.

الخصائص التقنية والأسعار

تقبل OCR 4 الصيغ الإدارية القياسية — PDF و DOC و PPT و OpenDocument — وتدعم 170 لغة عبر 10 مجموعات لغوية. تؤكد Mistral بشكل خاص على مكاسب الجودة للغات النادرة والقليلة الموارد، حيث تُظهر معظم الأنظمة المنافسة تدهوراً ملحوظاً.

القدرات الرئيسية:

  • bounding boxes — التوطين الدقيق لكل كتلة على الصفحة
  • صياغة الكتل — عناوين وجداول ومعادلات وتسميات توضيحية وصور
  • درجات الثقة — على مستوى الصفحة ولكل كلمة
  • 170 لغة في 10 مجموعات لغوية، بما في ذلك اللغات قليلة الموارد
  • نشر حاوية واحدة — يتسع النموذج بأكمله في حاوية واحدة

الأسعار عبر API: 4 دولارات لكل ألف صفحة. مع معالجة الدفعات عبر Batch API، ينطبق خصم بنسبة 50% — المجموع 2 دولار لكل ألف صفحة. Document AI في Mistral Studio (الواجهة بدون أكواد) بسعر 5 دولارات لكل ألف صفحة.

النشر الذاتي الاستضافة في حاوية واحدة متاح لعملاء الشركات الذين يعطون الأولوية لسيادة البيانات والامتثال التنظيمي ومعالجة الدفعات عالية الأداء. يجعل الحجم المضغوط للنموذج مناسباً لكل من السيناريوهات الموفرة للميزانية ومعالجة الحمل العالي.

المقاييس والتكاملات

فضل المُعلقون المستقلون OCR 4 على جميع أنظمة OCR و Document AI المختبرة — متوسط معدل الفوز كان 72٪. على معيار OlmOCRBench العام، حقق النموذج 85.20 — أفضل نتيجة بين الحلول المختبرة في وقت النشر.

"تحصل الأنظمة الموضوعية على الوصول ليس فقط إلى ما هو مكتوب في المستند، بل أيضاً إلى المكان الذي يقع فيه كل عنصر، والدور الذي يلعبه، ومدى ثقة النموذج في كل منطقة في الصفحة،" — هكذا تصف

Mistral فلسفة الإصدار.

يتم دمج OCR 4 في Mistral Search Toolkit — إطار عمل مفتوح للبحث الإداري تم الإعلان عنه في قمة AI Now. يخدم كمكون الاستيعاب لخطوط أنابيب RAG والبحث الإداري: يصبح الإخراج المنظم للنموذج إدخالاً جاهزاً للاستشهاد لأنظمة الاسترجاع والتصنيف وإعادة ترتيب النتائج.

ما يعنيه هذا

Mistral تحول التعرف على المستندات من أداة مساعدة إلى بدائية بنية تحتية لأنظمة الذكاء الاصطناعي الإدارية. الإخراج المنظم مع الإحداثيات وأنواع الكتل ودرجات الثقة — هذا هو بالضبط مستوى التفاصيل الذي تحتاجه الأنظمة الوكيلة للعمل الموثوق به مع المستندات الحقيقية. يحصل اللاعبون الذين يبنون منصات RAG وحلول استخبارات المستندات على مكون جاهز بدون الحاجة إلى معالجة لاحقة إضافية.

ZK
Hamidun News
أخبار الذكاء الاصطناعي بدون ضوضاء. اختيار تحريري يومي من أكثر من 400 مصدر. منتج من جمال حميدون، رئيس الذكاء الاصطناعي في Alpina Digital.

هل تحتاج إلى ذكاء اصطناعي يعمل داخل شركتك — وليس فقط في موجز الأخبار؟

أبني ذكاءً اصطناعياً جاهزاً للإنتاج للشركات — أنظمة CRM مخصّصة، أدوات داخلية، وكلاء مستقلون، أتمتة سير العمل. ملك لك، مصمّم وفق عمليتك، دون رسوم لكل مستخدم. من إعداد جمال خميدون، مدير المنتجات في AlpinaGPT (منصة ذكاء اصطناعي، أكثر من 6000 مستخدم).

ما رأيك؟
جارٍ تحميل التعليقات…