Hugging Face Blog→ original

Cómo un pequeño modelo superó a GPT-5 y Claude Opus en OCR de portugués

El modelo especializado Dharma-OCR (3B parámetros) superó a Claude Opus, Gemini y GPT-5 en el reconocimiento de texto portugués. Funcionó con mayor precisión, d

Procesado por IA desde Hugging Face Blog; editado por Hamidun News
Cómo un pequeño modelo superó a GPT-5 y Claude Opus en OCR de portugués
Fuente: Hugging Face Blog. Collage: Hamidun News.
◐ Escuchar artículo

Dharma AI publicó un benchmark que cuestiona el supuesto fundamental de la IA empresarial: que más parámetros = mejores resultados. Su modelo de 3 mil millones de parámetros, entrenado específicamente para OCR en portugués, superó simultáneamente a Claude Opus 4.6, Gemini 3.1 Pro y GPT-5.4 en calidad, estabilidad y costo.

Cuando los parámetros no son lo más importante

Dharma-OCR obtuvo una puntuación de 0.911 en texto portugués brasileño, Claude Opus — 0.833. Distorsión de texto: 0.20% frente a métricas desconocidas de los competidores. Y todo esto con un costo 52 veces menor.

Los investigadores no afirman que los modelos frontier sean malos. Dicen algo diferente: cuando un modelo se entrena cercano a la tarea real de implementación, la cantidad de parámetros deja de ser el factor decisivo.

Tres niveles de especialización

No se trata simplemente de comprimir el modelo. Los autores identificaron una jerarquía:

  • Nivel 1 — propósito general: Qwen 2.5, GPT — entrenados en distribuciones amplias
  • Nivel 2 — especialistas de dominio: modelos para OCR general que han visto muchas pruebas y documentos
  • Nivel 3 — especialistas estrechos: Dharma-OCR entrenado solo en portugués + especificidad de documentos brasileños

El efecto se acumula. Con 7B parámetros, Qwen general obtiene 0.906, mientras que el especialista en OCR olmOCR — 0.927 (2.3% de mejora). Con 3B parámetros, la brecha es aún mayor: Nanonets-OCR2 superó a Qwen en 16% de calidad y redujo la distorsión de texto en 7 veces.

Repensar la selección de modelos

Actualmente, las empresas eligen con la lógica: "¿Cuál es el modelo más avanzado en el mercado?" El artículo propone añadir la pregunta: "¿Qué tan cercano fue el entrenamiento de este modelo a mi tarea?"

«Los parámetros y la escala siguen siendo importantes.

Pero la especialización es una variable que se subestima sistemáticamente en contratos y RFP», — dicen los autores.

Esto cambia el cálculo del ROI. Una economía de 52x en costos con mejor calidad no es un hecho interesante, es una señal para reestructurar el stack de IA. En lugar de un único modelo universal, las empresas pueden construir un ecosistema: uno entrenado para OCR, uno para clasificación, uno para chat.

Qué significa esto

Hasta finales de 2025, dominaba la tendencia: "siempre toma el modelo más grande de la lista". Dharma AI añade una variable: antes de pagar por Opus, verifica si hay un modelo que haya visto exactamente tus documentos. Tal vez la respuesta ya esté allí por centavos.

ZK
Hamidun News
Noticias de AI sin ruido. Selección editorial diaria de más de 400 fuentes. Producto de Zhemal Khamidun, Head of AI en Alpina Digital.

¿Quieres dejar de leer sobre IA y empezar a usarla?

AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.

¿Qué te parece?
Cargando comentarios…