Como um modelo pequeno superou GPT-5 e Claude Opus no reconhecimento óptico de caracteres em português

O modelo especializado Dharma-OCR (3B parâmetros) superou Claude Opus, Gemini e GPT-5 no reconhecimento de texto em português. Funcionou com maior precisão, causou menos distorções no texto e custou 52 vezes menos. Conclusão: para tarefas específicas, a especialização é mais importante que a escala.

Khamidun Zhemal

Monitoramento de AI · Hugging Face Blog

26 de mai. de 2026· 3 min·atualizado 12 de jul. de 2026

Processado por IA de Hugging Face Blog; editado por Hamidun News

Como um modelo pequeno superou GPT-5 e Claude Opus no reconhecimento óptico de caracteres em português — Fonte: Hugging Face Blog. Colagem: Hamidun News.

◐ Ouvir artigo

A Dharma AI publicou um benchmark que questiona a suposição fundamental da IA empresarial: mais parâmetros = melhor resultado. Seu modelo de 3 bilhões de parâmetros, treinado especificamente para OCR em português, superou Claude Opus 4.6, Gemini 3.1 Pro e GPT-5.4 simultaneamente em qualidade, estabilidade e custo.

Quando os parâmetros não são os mais importantes

A Dharma-OCR obteve 0,911 pontos em textos em português brasileiro, Claude Opus — 0,833. Distorção de texto: 0,20% contra métricas desconhecidas dos concorrentes. E tudo isso com custo 52 vezes menor.

Os cientistas não afirmam que os modelos frontier são ruins. Eles dizem algo diferente: quando um modelo é treinado próximo à tarefa real de implantação, o número de parâmetros deixa de ser um fator decisivo.

Três níveis de especialização

Não se trata apenas de comprimir o modelo. Os autores identificaram uma hierarquia:

Nível 1 — propósito geral: Qwen 2.5, GPT — treinados em distribuições amplas
Nível 2 — especialistas de domínio: modelos para OCR geral que viram muitos testes e documentos
Nível 3 — especialistas especializados: Dharma-OCR treinado apenas para português + especificidades de documentos brasileiros

O efeito se acumula. Com 7B parâmetros, o Qwen geral alcança 0,906, enquanto o especialista em OCR olmOCR — 0,927 (2,3% a mais). Com 3B parâmetros, o gap é ainda maior: Nanonets-OCR2 superou Qwen em 16% de qualidade e reduziu a distorção de texto em 7 vezes.

Repensando a seleção de modelos

Atualmente, as empresas escolhem com a lógica: "qual é o modelo mais avançado no marketplace?" O artigo sugere adicionar a pergunta: "o quão próximo este modelo foi treinado para minha tarefa específica?"

«Parâmetros e escala continuam sendo importantes.

Mas especialização é uma variável que é sistematicamente subestimada em contratos e RFPs», — dizem os autores.

Isso muda o cálculo de ROI. Uma economia de 52x em custo com melhor qualidade — isso não é um fato interessante, é um sinal para reestruturar o stack de IA. Em vez de um modelo universal, as empresas podem construir um ecossistema: um treinado para OCR, um para classificação, um para chat.

O que isso significa

Até o final de 2025, dominava a tendência: "sempre pegue o modelo maior da lista." A Dharma AI adiciona uma variável: antes de pagar pelo Opus, verifique se existe um modelo que foi treinado especificamente com seus documentos. Talvez a resposta já esteja lá por centavos.

Hamidun News

Notícias de AI sem ruído. Seleção editorial diária de mais de 50 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.

Canal do Telegram RSS hamidun.com

Quer parar de ler sobre IA e começar a usar?

AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.

🎓 Academy — 7 dias grátis Consultoria grátis