Como um modelo pequeno superou GPT-5 e Claude Opus no reconhecimento óptico de caracteres em português
O modelo especializado Dharma-OCR (3B parâmetros) superou Claude Opus, Gemini e GPT-5 no reconhecimento de texto em português. Funcionou com maior precisão, cau
Processado por IA de Hugging Face Blog; editado por Hamidun News
A Dharma AI publicou um benchmark que questiona a suposição fundamental da IA empresarial: mais parâmetros = melhor resultado. Seu modelo de 3 bilhões de parâmetros, treinado especificamente para OCR em português, superou Claude Opus 4.6, Gemini 3.1 Pro e GPT-5.4 simultaneamente em qualidade, estabilidade e custo.
Quando os parâmetros não são os mais importantes
A Dharma-OCR obteve 0,911 pontos em textos em português brasileiro, Claude Opus — 0,833. Distorção de texto: 0,20% contra métricas desconhecidas dos concorrentes. E tudo isso com custo 52 vezes menor.
Os cientistas não afirmam que os modelos frontier são ruins. Eles dizem algo diferente: quando um modelo é treinado próximo à tarefa real de implantação, o número de parâmetros deixa de ser um fator decisivo.
Três níveis de especialização
Não se trata apenas de comprimir o modelo. Os autores identificaram uma hierarquia:
- Nível 1 — propósito geral: Qwen 2.5, GPT — treinados em distribuições amplas
- Nível 2 — especialistas de domínio: modelos para OCR geral que viram muitos testes e documentos
- Nível 3 — especialistas especializados: Dharma-OCR treinado apenas para português + especificidades de documentos brasileiros
O efeito se acumula. Com 7B parâmetros, o Qwen geral alcança 0,906, enquanto o especialista em OCR olmOCR — 0,927 (2,3% a mais). Com 3B parâmetros, o gap é ainda maior: Nanonets-OCR2 superou Qwen em 16% de qualidade e reduziu a distorção de texto em 7 vezes.
Repensando a seleção de modelos
Atualmente, as empresas escolhem com a lógica: "qual é o modelo mais avançado no marketplace?" O artigo sugere adicionar a pergunta: "o quão próximo este modelo foi treinado para minha tarefa específica?"
«Parâmetros e escala continuam sendo importantes.
Mas especialização é uma variável que é sistematicamente subestimada em contratos e RFPs», — dizem os autores.
Isso muda o cálculo de ROI. Uma economia de 52x em custo com melhor qualidade — isso não é um fato interessante, é um sinal para reestruturar o stack de IA. Em vez de um modelo universal, as empresas podem construir um ecossistema: um treinado para OCR, um para classificação, um para chat.
O que isso significa
Até o final de 2025, dominava a tendência: "sempre pegue o modelo maior da lista." A Dharma AI adiciona uma variável: antes de pagar pelo Opus, verifique se existe um modelo que foi treinado especificamente com seus documentos. Talvez a resposta já esteja lá por centavos.
Quer parar de ler sobre IA e começar a usar?
AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.