Hugging Face Blog→ original

Comment un petit modèle a surpassé GPT-5 et Claude Opus en OCR portugais

Le modèle spécialisé Dharma-OCR (3B paramètres) a surpassé Claude Opus, Gemini et GPT-5 dans la reconnaissance de texte portugais. Il fonctionnait plus précisém

Traité par IA depuis Hugging Face Blog ; édité par Hamidun News
Comment un petit modèle a surpassé GPT-5 et Claude Opus en OCR portugais
Source : Hugging Face Blog. Collage: Hamidun News.
◐ Écouter l'article

Dharma AI a publié un benchmark qui remet en question l'hypothèse fondamentale de l'IA d'entreprise : plus de paramètres = meilleurs résultats. Son modèle de 3 milliards de paramètres, entraîné spécifiquement pour l'OCR portugais, a surpassé simultanément Claude Opus 4.6, Gemini 3.1 Pro et GPT-5.4 en qualité, stabilité et coût.

Quand les paramètres ne sont vraiment pas les principaux

Dharma-OCR a obtenu un score de 0.911 sur le texte portugais brésilien, Claude Opus — 0.833. Distorsion de texte : 0.20% contre des mesures inconnues chez les concurrents. Et tout cela à un coût 52 fois inférieur. Les scientifiques ne prétendent pas que les modèles frontier sont mauvais. Ils disent autre chose : lorsqu'un modèle a été entraîné près de la tâche de déploiement réelle, le nombre de paramètres cesse d'être le facteur décisif.

Trois niveaux de spécialisation

Il ne s'agit pas simplement de compresser le modèle. Les auteurs ont identifié une hiérarchie :

  • Level 1 — À usage général : Qwen 2.5, GPT — entraînés sur des distributions larges
  • Level 2 — Spécialistes de domaine : modèles pour OCR général qui ont vu de nombreux tests et documents
  • Level 3 — Spécialistes étroits : Dharma-OCR entraîné uniquement pour le portugais + spécificités des documents brésiliens

L'effet s'accumule. Avec 7B paramètres, le Qwen général obtient 0.906, tandis que le spécialiste OCR olmOCR obtient 0.927 (plus 2.3%). Avec 3B paramètres, l'écart est encore plus grand : Nanonets-OCR2 a surpassé Qwen de 16% en qualité et a réduit la distorsion de texte de 7 fois.

Repenser le choix des modèles

Actuellement, les entreprises choisissent selon la logique : « quel est le modèle le plus avancé sur le marché ? » L'article propose d'ajouter une question : « dans quelle mesure ce modèle a-t-il été entraîné près de ma tâche ? »

« Les paramètres et l'échelle n'ont pas cessé d'être importants.

Mais la spécialisation est une variable qui est systématiquement sous-estimée dans les contrats et les RFP », — les auteurs.

Cela change le calcul du ROI. Une économie de 52x sur les coûts avec une meilleure qualité n'est pas un fait intéressant, c'est un signal pour restructurer la pile IA. Au lieu d'un seul modèle universel, les entreprises peuvent construire un écosystème : un entraîné pour OCR, un pour la classification, un pour le chat.

Ce que cela signifie

Jusqu'à la fin 2025, la tendance dominante était : « prenez toujours le plus grand modèle de la liste ». Dharma AI ajoute une variable : avant de payer pour Opus, vérifiez s'il existe un modèle qui a vu exactement vos documents. Il y a peut-être déjà une réponse pour un prix dérisoire.

ZK
Hamidun News
Actualités IA sans bruit. Sélection éditoriale quotidienne de plus de 400 sources. Produit de Zhemal Khamidun, Head of AI chez Alpina Digital.

Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?

AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.

Qu'en pensez-vous ?
Chargement des commentaires…