36Kr (36氪)→ original

MinerU foi adaptado para rodar em 10 modelos de chips chineses de AI

A equipe OpenDataLab, do Shanghai AI Laboratory, anunciou a conclusão de uma adaptação profunda da ferramenta MinerU para rodar em mais de 10 plataformas…

Processado por IA de 36Kr (36氪); editado por Hamidun News
MinerU foi adaptado para rodar em 10 modelos de chips chineses de AI
Fonte: 36Kr (36氪). Colagem: Hamidun News.
◐ Ouvir artigo

# MinerU adaptado para funcionar em 10 modelos de chips IA chineses: por que isso é crítico para a independência da cadeia tecnológica

Desenvolvedores de inteligência artificial chineses receberam uma ferramenta há muito esperada para superar a dependência de equipamentos ocidentais. O time OpenDataLab do Laboratório de IA de Xangai, em colaboração com a DeepLink e vários fabricantes de chips nacionais, anunciou a conclusão da adaptação do MinerU — um parser de documentos de alta precisão — para funcionamento em mais de 10 diferentes plataformas computacionais de produção local. Entre elas estão as arquiteturas Ascend, T-Head e Metax. Este trabalho destaca o esforço em larga escala da região para reduzir a dependência tecnológica e construir seu próprio ecossistema de inovação.

MinerU não é simplesmente mais uma ferramenta de processamento de texto. É um sistema especializado que transforma arquivos PDF complexos, páginas da web, fórmulas matemáticas e tabelas intrincadas em dados estruturados que grandes modelos de linguagem podem processar adequadamente. A precisão da conversão atinge 99%, o que é criticamente importante porque a qualidade dos dados de treinamento afeta diretamente as capacidades do modelo resultante. Essencialmente, MinerU resolve um problema que há muito tempo é um gargalo na preparação de dados para IA: como extrair significado de milhões de documentos não estruturados armazenados em arquivos corporativos e registros governamentais.

O problema existe não apenas em teoria. Quando empresas e órgãos governamentais tentam digitalizar seus arquivos ou preparar conjuntos de dados para treinamento de modelos, enfrentam uma avalanche de arquivos PDF, documentos digitalizados e tabelas que precisam ser convertidos para formato legível por máquina. Fazer isso manualmente é impossível, e as soluções existentes frequentemente perdem contexto, distorcem fórmulas ou interpretam mal elementos visuais. MinerU resolve essa tarefa com precisão próxima à perfeita, permitindo que organizações economizem meses de trabalho e recursos humanos.

Mas qual é o verdadeiro significado dessa notícia? Adaptar o MinerU para 10+ plataformas de chips nacionais significa que desenvolvedores chineses agora podem construir um ciclo completo de produção de IA sem recorrer a componentes americanos e europeus. Isso se aplica a todos os estágios: desde coleta e preparação de dados até treinamento de modelos. Quando a infraestrutura roda em chips locais — seja Ascend da Huawei ou T-Head da Alibaba — toda a cadeia de criação de valor permanece no país.

O contexto geopolítico aqui é inevitável. As tensões entre o Ocidente e a China levaram a sanções à exportação de semicondutores avançados, forçando a região a investir em seu próprio desenvolvimento. OpenDataLab escolheu precisamente este momento para concluir a adaptação do MinerU, sinalizando que a base tecnológica local é suficientemente desenvolvida para lançar projetos de engenharia complexos. Isto não é simplesmente um sucesso técnico — é uma demonstração do estado da indústria de IA local.

Para usuários do mercado global, isso significa o surgimento de uma fonte alternativa de dados e ferramentas para processamento de documentos. Para empresas chinesas e órgãos governamentais, isso abre a possibilidade de dimensionar seus projetos de IA sem limitações de equipamentos. E embora a adaptação não mude a própria tecnologia, ela muda a economia de sua aplicação: agora trabalhar com MinerU é possível de forma mais barata e sem preocupações sobre como as sanções impactam a cadeia de suprimentos.

ZK
Hamidun News
Notícias de AI sem ruído. Seleção editorial diária de mais de 400 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.

Quer parar de ler sobre IA e começar a usar?

AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.

O que você acha?
Carregando comentários…