MinerU foi adaptado para rodar em 10 modelos de chips chineses de AI
A equipe OpenDataLab, do Shanghai AI Laboratory, anunciou a conclusão de uma adaptação profunda da ferramenta MinerU para rodar em mais de 10 plataformas…
Processado por IA de 36Kr (36氪); editado por Hamidun News
# MinerU adaptado para funcionar em 10 modelos de chips IA chineses: por que isso é crítico para a independência da cadeia tecnológica
Desenvolvedores de inteligência artificial chineses receberam uma ferramenta há muito esperada para superar a dependência de equipamentos ocidentais. O time OpenDataLab do Laboratório de IA de Xangai, em colaboração com a DeepLink e vários fabricantes de chips nacionais, anunciou a conclusão da adaptação do MinerU — um parser de documentos de alta precisão — para funcionamento em mais de 10 diferentes plataformas computacionais de produção local. Entre elas estão as arquiteturas Ascend, T-Head e Metax. Este trabalho destaca o esforço em larga escala da região para reduzir a dependência tecnológica e construir seu próprio ecossistema de inovação.
MinerU não é simplesmente mais uma ferramenta de processamento de texto. É um sistema especializado que transforma arquivos PDF complexos, páginas da web, fórmulas matemáticas e tabelas intrincadas em dados estruturados que grandes modelos de linguagem podem processar adequadamente. A precisão da conversão atinge 99%, o que é criticamente importante porque a qualidade dos dados de treinamento afeta diretamente as capacidades do modelo resultante. Essencialmente, MinerU resolve um problema que há muito tempo é um gargalo na preparação de dados para IA: como extrair significado de milhões de documentos não estruturados armazenados em arquivos corporativos e registros governamentais.
O problema existe não apenas em teoria. Quando empresas e órgãos governamentais tentam digitalizar seus arquivos ou preparar conjuntos de dados para treinamento de modelos, enfrentam uma avalanche de arquivos PDF, documentos digitalizados e tabelas que precisam ser convertidos para formato legível por máquina. Fazer isso manualmente é impossível, e as soluções existentes frequentemente perdem contexto, distorcem fórmulas ou interpretam mal elementos visuais. MinerU resolve essa tarefa com precisão próxima à perfeita, permitindo que organizações economizem meses de trabalho e recursos humanos.
Mas qual é o verdadeiro significado dessa notícia? Adaptar o MinerU para 10+ plataformas de chips nacionais significa que desenvolvedores chineses agora podem construir um ciclo completo de produção de IA sem recorrer a componentes americanos e europeus. Isso se aplica a todos os estágios: desde coleta e preparação de dados até treinamento de modelos. Quando a infraestrutura roda em chips locais — seja Ascend da Huawei ou T-Head da Alibaba — toda a cadeia de criação de valor permanece no país.
O contexto geopolítico aqui é inevitável. As tensões entre o Ocidente e a China levaram a sanções à exportação de semicondutores avançados, forçando a região a investir em seu próprio desenvolvimento. OpenDataLab escolheu precisamente este momento para concluir a adaptação do MinerU, sinalizando que a base tecnológica local é suficientemente desenvolvida para lançar projetos de engenharia complexos. Isto não é simplesmente um sucesso técnico — é uma demonstração do estado da indústria de IA local.
Para usuários do mercado global, isso significa o surgimento de uma fonte alternativa de dados e ferramentas para processamento de documentos. Para empresas chinesas e órgãos governamentais, isso abre a possibilidade de dimensionar seus projetos de IA sem limitações de equipamentos. E embora a adaptação não mude a própria tecnologia, ela muda a economia de sua aplicação: agora trabalhar com MinerU é possível de forma mais barata e sem preocupações sobre como as sanções impactam a cadeia de suprimentos.
Quer parar de ler sobre IA e começar a usar?
AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.