PaddleOCR 3.5 получил поддержку Transformers от Hugging Face

Q: ¿Cuál es la fuente?

Publicado originalmente en Hugging Face Blog. Hamidun News procesa y adapta los materiales con IA.

Q: ¿Cuándo se publicó?

2026-05-21. Tiempo de lectura: 3 min.

PaddleOCR выпустил версию 3.5 с полной поддержкой Transformers как инференс-backend. Теперь команды могут запускать OCR и парсинг документов в PyTorch-окружении

Redacción de Hamidun News

Monitoreo de AI · Hugging Face Blog

2026-05-21· 2 min

Procesado por IA desde Hugging Face Blog; editado por Hamidun News

PaddleOCR 3.5 получил поддержку Transformers от Hugging Face — Fuente: Hugging Face Blog. Collage: Hamidun News.

PaddleOCR обновилась до версии 3.5 и теперь работает на Transformers из Hugging Face. Вместо собственного Paddle inference engine команды могут использовать привычное PyTorch-окружение для распознавания текста и парсинга документов.

Трансформеры вместо

Paddle До выхода версии 3.5 PaddleOCR была «привязана» к Paddle inference engine — собственному runtime от Baidu. Это означало, что для работы с библиотекой нужно было установить весь Paddle стек, даже если команда уже использовала PyTorch. Версия 3.5 решает эту проблему: добавлен гибкий интерфейс выбора backend через параметр `engine`. Теперь если установлен Transformers, достаточно указать `engine="transformers"` — и OCR-модели будут работать на PyTorch. Это особенно удобно для команд, уже использующих PyTorch и Transformers в других частях проекта. Не нужно поддерживать две отдельные runtime, не нужно переключаться между инструментами при переходе от exploration к production.

Что поддерживается

Transformers backend работает с двумя семействами моделей: PP-OCRv5 — распознавание текста на изображениях и документах, включая многоязычный OCR PaddleOCR-VL 1.5 — парсинг документов с визуальным пониманием макета и структуры страницы * Гибкая конфигурация через engine_config: выбор типа данных (float32, bfloat16), device placement, тип внимания (sdpa для оптимизации) Пример использования раньше был простой — `paddleocr ocr -i image.png`. Теперь то же самое, но на Transformers backend: `paddleocr ocr -i image.png --engine transformers`. В Python API можно конфигурировать детальнее, указав тип данных и реализацию внимания через `engine_config`.

Для кого это полезно Transformers backend идеален для нескольких сценариев.

Во-первых, если вы уже работаете с PyTorch-стеком — не нужно учиться новому инструменту. Во-вторых, если строите RAG-приложения (retrieval-augmented generation), где нужно парсить PDF и извлекать структурированные данные для индексирования. В-третьих, для Document AI проектов — когда нужно автоматизировать обработку больших объёмов документов. Стандартный Paddle backend по-прежнему полезен, если скорость обработки критична и нужен максимальный throughput. Он немного быстрее благодаря оптимизациям, специфичным для Paddle runtime.

Что это значит

PaddleOCR постепенно перестаёт быть изолированным инструментом и становится одной из опций в более широкой экосистеме Transformers. Для RAG и Document AI-приложений это значительно упрощает pipeline: теперь единый PyTorch-стек может использоваться для embeddings, языковых моделей и парсинга документов. Это снижает сложность production-deployment и упрощает поддержку единой версии зависимостей.

Hamidun News

Noticias de AI sin ruido. Selección editorial diaria de más de 400 fuentes. Producto de Zhemal Khamidun, Head of AI en Alpina Digital.

Canal de Telegram RSS hamidun.com

¿Quieres dejar de leer sobre IA y empezar a usarla?

AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.

🎓 Academy — 7 días gratis Consulta gratuita