Hugging Face Blog→ المصدر

PaddleOCR 3.5 يحصل على دعم Transformers من Hugging Face

أطلقت PaddleOCR الإصدار 3.5 بدعم كامل لـ Transformers كمحرك استدلال خلفي. يمكن للفريق الآن تشغيل OCR وتحليل المستندات في بيئة PyTorch. سيؤدي هذا إلى تبسيط التكا

معالج بواسطة الذكاء الاصطناعي من Hugging Face Blog؛ بتحرير Hamidun News
PaddleOCR 3.5 يحصل على دعم Transformers من Hugging Face
المصدر: Hugging Face Blog. كولاج: Hamidun News.
◐ استمع للمقال

تم تحديث PaddleOCR إلى الإصدار 3.5 وتعمل الآن على Transformers من Hugging Face. بدلاً من استخدام محرك استدلال Paddle الخاص بها، يمكن للفريق استخدام بيئة PyTorch المألوفة للتعرف على النصوص وتحليل المستندات.

Transformers بدلاً من Paddle

قبل إصدار 3.5، كانت PaddleOCR مرتبطة بمحرك استدلال Paddle - البيئة الخاصة بـ Baidu. كان هذا يعني أنه لاستخدام المكتبة، كان يتوجب تثبيت كامل مكدس Paddle، حتى لو كان الفريق يستخدم بالفعل PyTorch. يحل الإصدار 3.5 هذه المشكلة بإضافة واجهة مرنة لاختيار المحرك الخلفي عبر معامل `engine`. الآن يكفي تحديد `engine="transformers"` وستعمل نماذج OCR على PyTorch. هذا مفيد بشكل خاص للفريق الذي يستخدم بالفعل PyTorch و Transformers في أجزاء أخرى من المشروع. لا حاجة للحفاظ على بيئتين منفصلتين ولا للتبديل بين الأدوات عند الانتقال من المرحلة الاستكشافية إلى الإنتاج.

الميزات المدعومة

يعمل محرك Transformers الخلفي مع عائلتي نماذج:

  • PP-OCRv5 - التعرف على النصوص في الصور والمستندات، بما في ذلك OCR متعدد اللغات
  • PaddleOCR-VL 1.5 - تحليل المستندات مع الفهم البصري للتخطيط وهيكل الصفحة
  • تكوين مرن عبر engine_config: اختيار نوع البيانات (float32, bfloat16)، توزيع الأجهزة، نوع الاهتمام (sdpa للتحسين)

كان مثال الاستخدام السابق بسيطاً - `paddleocr ocr -i image.png`. الآن نفس الشيء، لكن على محرك Transformers الخلفي: `paddleocr ocr -i image.png --engine transformers`. في Python API يمكن إجراء تكوين أكثر تفصيلاً بتحديد نوع البيانات وتنفيذ الاهتمام عبر `engine_config`.

من يستفيد من هذا

محرك Transformers الخلفي مثالي لعدة سيناريوهات. أولاً، إذا كنت تعمل بالفعل مع مكدس PyTorch - لا حاجة لتعلم أداة جديدة. ثانياً، إذا كنت تبني تطبيقات RAG (الجيل المعزز بالاسترجاع)، حيث تحتاج إلى تحليل ملفات PDF واستخراج البيانات المنظمة للفهرسة. ثالثاً، لمشاريع Document AI - عندما تحتاج إلى أتمتة معالجة كميات كبيرة من المستندات. محرك Paddle الخلفي القياسي لا يزال مفيداً إذا كانت سرعة المعالجة حرجة وتحتاج إلى أقصى إنتاجية. فهو أسرع قليلاً بفضل التحسينات الخاصة بـ Paddle runtime.

ماذا يعني هذا

تتحول PaddleOCR تدريجياً من كونها أداة معزولة إلى أحد الخيارات في النظام البيئي الأوسع للـ Transformers. بالنسبة لتطبيقات RAG و Document AI، يؤدي هذا إلى تبسيط خط الأنابيب بشكل كبير: يمكن استخدام مكدس PyTorch الموحد للتضمينات والنماذج اللغوية وتحليل المستندات. هذا يقلل من تعقيد نشر الإنتاج ويسهل الحفاظ على نسخة موحدة من التبعيات.

ZK
Hamidun News
أخبار الذكاء الاصطناعي بدون ضوضاء. اختيار تحريري يومي من أكثر من 400 مصدر. منتج من جمال حميدون، رئيس الذكاء الاصطناعي في Alpina Digital.

هل تريد التوقف عن قراءة الذكاء الاصطناعي والبدء باستخدامه؟

AI News هو موجز منسق لأخبار الذكاء الاصطناعي. تعلمك Hamidun Academy استخدام الذكاء الاصطناعي في عملك.

ما رأيك؟
جارٍ تحميل التعليقات…