36Kr (36氪)→ original

MinerU a été adapté pour fonctionner sur 10 modèles de puces AI chinoises

L'équipe OpenDataLab du Shanghai AI Laboratory a annoncé avoir achevé une adaptation en profondeur de l'outil MinerU pour qu'il fonctionne sur plus de 10…

Traité par IA depuis 36Kr (36氪) ; édité par Hamidun News
MinerU a été adapté pour fonctionner sur 10 modèles de puces AI chinoises
Source : 36Kr (36氪). Collage: Hamidun News.
◐ Écouter l'article

# MinerU adapté pour fonctionner sur 10 modèles de puces IA chinoises : pourquoi c'est critique pour l'indépendance de la chaîne technologique

Les développeurs d'intelligence artificielle chinois ont reçu un outil longtemps attendu pour surmonter la dépendance à l'égard des équipements occidentaux. L'équipe OpenDataLab du Laboratoire IA de Shanghai, en collaboration avec DeepLink et plusieurs fabricants de puces nationaux, a annoncé l'achèvement de l'adaptation de MinerU — un analyseur de documents haute précision — pour fonctionner sur plus de 10 différentes plates-formes informatiques de production nationale. Parmi celles-ci se trouvent les architectures Ascend, T-Head et Metax. Ce travail souligne l'effort à grande échelle de la région pour réduire la dépendance technologique et construire son propre écosystème d'innovation.

MinerU n'est pas simplement un autre outil de traitement de texte. C'est un système spécialisé qui transforme les fichiers PDF complexes, les pages web, les formules mathématiques et les tableaux complexes en données structurées que les grands modèles de langage peuvent traiter correctement. La précision de la conversion atteint 99%, ce qui est cruciale car la qualité des données d'entraînement affecte directement les capacités du modèle résultant. Essentiellement, MinerU résout un problème qui a longtemps été un goulot d'étranglement dans la préparation des données pour l'IA : comment extraire du sens à partir de millions de documents non structurés stockés dans les archives d'entreprises et les registres gouvernementaux.

Le problème n'existe pas seulement en théorie. Lorsque les entreprises et les institutions gouvernementales tentent de numériser leurs archives ou de préparer des ensembles de données pour l'entraînement de modèles, elles font face à une avalanche de fichiers PDF, de documents numérisés et de tableaux qui doivent être convertis en format lisible par machine. Faire cela manuellement est impossible, et les solutions existantes perdent souvent le contexte, déforment les formules ou interprètent mal les éléments visuels. MinerU résout cette tâche avec une précision proche de la perfection, permettant aux organisations d'économiser des mois de travail et de ressources humaines.

Mais quelle est la véritable signification de cette nouvelle ? Adapter MinerU pour plus de 10 plates-formes de puces nationales signifie que les développeurs chinois peuvent désormais construire un cycle complet de production d'IA sans recourir aux composants américains et européens. Cela s'applique à toutes les étapes : de la collecte et préparation des données à l'entraînement des modèles. Lorsque l'infrastructure fonctionne sur des puces locales — qu'il s'agisse d'Ascend de Huawei ou de T-Head d'Alibaba — toute la chaîne de création de valeur reste dans le pays.

Le contexte géopolitique est ici inévitable. Les tensions entre l'Occident et la Chine ont conduit à des sanctions sur l'exportation de semi-conducteurs avancés, forçant la région à investir dans son propre développement. OpenDataLab a choisi précisément ce moment pour achever l'adaptation de MinerU, signalant que la base technologique locale est suffisamment développée pour lancer des projets d'ingénierie complexes. Ceci n'est pas simplement un succès technique — c'est une démonstration de l'état de l'industrie de l'IA locale.

Pour les utilisateurs du marché mondial, cela signifie l'émergence d'une source alternative de données et d'outils pour le traitement des documents. Pour les entreprises chinoises et les organismes gouvernementaux, cela ouvre la possibilité d'évoluer leurs projets d'IA sans contraintes d'équipements. Et bien que l'adaptation ne change pas la technologie elle-même, elle change l'économie de son application : maintenant travailler avec MinerU est possible plus économiquement et sans préoccupations concernant l'impact des sanctions sur la chaîne d'approvisionnement.

ZK
Hamidun News
Actualités IA sans bruit. Sélection éditoriale quotidienne de plus de 400 sources. Produit de Zhemal Khamidun, Head of AI chez Alpina Digital.

Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?

AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.

Qu'en pensez-vous ?
Chargement des commentaires…