Comment automatiser la lecture de plans techniques: 6 modèles YOLO au lieu du travail manuel
Un système composé de 6 modèles YOLO et d'un OCR personnalisé extrait automatiquement de plans techniques tous les paramètres qui influent sur le coût: dimensio

Extraire des données de plans techniques manuellement est un travail fastidieux sujet aux erreurs. Lors de la commande de fabrication d'une pièce personnalisée, vous devez entrer manuellement environ 20 paramètres du plan dans une calculatrice : dimensions, filetages, tolérances, rugosité de surface, écarts, matériau, poids. Une équipe d'ingénierie a mis en place un pipeline automatisé qui prend un plan en PDF, le lit comme le ferait un humain, et en extrait tout ce qui est nécessaire sous forme structurée. La sortie est du JSON pour la calculatrice.
Architecture de la Solution
Le système fonctionne en trois étapes : localisation des données, reconnaissance de texte, synthèse des résultats. Un plan PDF entre, du JSON avec des paramètres sort. Étapes intermédiaires :
- Normalisation de la résolution et du contraste
- Extraction des projections (vue de face, de côté, de dessus)
- Séparation du contour de la pièce des lignes auxiliaires
- Localisation des champs de texte et des flèches de dimension
- Reconnaissance des symboles (filetage, tolérance, rugosité)
- Liaison des flèches à leurs valeurs via un graphe de connectivité
Composants du Pipeline
Six modèles YOLO spécialisés sont utilisés pour la vision par ordinateur. Chacun est entraîné sur un sous-ensemble de 500+ plans réels de production :
1. Détection des projections — trouve les vues de face, de côté, de dessus sur le plan. 2. Localisation des dimensions — met en évidence toutes les flèches de dimension et les champs de texte. 3. Reconnaissance de symboles spéciaux — lit les désignations de filetage (M10), les degrés de tolérance (IT6), la rugosité de surface (Ra 3.2). 4. Contour de la pièce — sépare le contour visible des lignes auxiliaires. 5. Lignes auxiliaires — trouve les lignes d'axe et les éléments de construction auxiliaires. 6. Flèches et indicateurs — localise tous les types de flèches et les valeurs de texte associées.
Un OCR personnalisé est connecté à YOLO — les solutions standard ont du mal à lire les annotations manuscrites et les symboles spéciaux comme ∅ (diamètre) et les conventions de désignation des filetages. Le réseau de neurones a été entraîné sur un ensemble de données avec des annotations d'experts. La logique des flèches est un graphe pondéré : si une flèche commence au point A, traverse l'objet géométrique B et se termine près du texte C, alors la valeur C appartient à l'objet A. En pratique, c'est plus complexe : les flèches peuvent être en pointillés, en forme de S, plusieurs flèches peuvent pointer vers un même endroit, créant une ambiguïté.
La Réalité s'Impose
Les tests sur des plans de production ont révélé des problèmes qui n'existent pas dans les ensembles de données idéaux :
- Numérisations sales — plans vieux de 20 ans, numérisations depuis des photocopieuses, taches d'eau, marques de crayon aléatoires.
- Libertés typographiques — les filetages peuvent être écrits comme « Ø10×1.5 », « M10 » ou même dessinés comme un ressort.
- Annotations colorées — dimensions mises en évidence au stylo rouge, mais l'OCR filtre souvent les lignes rouges comme du bruit.
- Feuilles surpeuplées — 30+ dimensions sur un plan, les flèches se croisent, créant de la confusion.
La solution est venue de l'augmentation de données : des plans synthétiques ont été générés avec du bruit ajouté, du désordre, des changements de contraste et une imitation de vieux numérisations. Après l'entraînement sur l'ensemble de données étendu, la qualité sur les plans sales est passée de 68 % à 92 %.
Ce Que Cela Signifie
Automatiser la lecture de plans est un exemple de la façon dont le travail humain est remplacé par une combinaison d'outils publiquement disponibles (YOLO) + logique d'ingénierie (graphe de flèches) + ajustement spécialisé. Pour la fabrication, c'est une accélération de 15x : au lieu de 30 minutes de saisie manuelle — 2 minutes en pilotage automatique. Pour les affaires — livraison plus rapide des devis sans saisie manuelle de données.