كيفية أتمتة قراءة الرسومات الهندسية: 6 نماذج YOLO بدلًا من العمل اليدوي
يستخرج نظام مكوّن من 6 نماذج YOLO وOCR مخصص تلقائيًا من الرسومات الهندسية جميع المعلمات التي تؤثر في التكلفة: الأبعاد، والسنون اللولبية، والمادة، ودرجات التفاوت

استخراج البيانات من الرسومات الهندسية يدويًا عمل مملّ عرضة للأخطاء. عند طلب تصنيع قطعة مخصصة، تحتاج إلى إدخال حوالي 20 معاملة من الرسم يدويًا في الآلة الحاسبة: الأبعاد والخيوط والتسامحات وخشونة السطح والانحرافات والمادة والوزن. قام فريق هندسي بتجميع خط أنابيب مؤتمت يأخذ رسمًا بصيغة PDF ويقرأه كما يفعل الإنسان ويستخرج كل ما هو ضروري بشكل منظم. الناتج هو JSON لآلة حاسبة.
معمارية الحل
يعمل النظام في ثلاث خطوات: تحديد موقع البيانات والتعرف على النص وتوليف النتائج. يدخل رسم PDF ويخرج JSON مع المعاملات. المراحل الوسيطة:
- تطبيع الدقة والتباين
- استخراج الإسقاطات (منظر أمامي وجانبي وعلوي)
- فصل خطوط الملامح عن الخطوط المساعدة
- تحديد موقع حقول النص وأسهم الأبعاد
- التعرف على الرموز (الخيط والتسامح والخشونة)
- ربط الأسهم بقيمها من خلال رسم بياني للاتصال
مكونات خط الأنابيب
يتم استخدام ستة نماذج YOLO متخصصة لرؤية الحاسوب. يتم تدريب كل منها على مجموعة فرعية من 500+ رسومات إنتاجية حقيقية:
1. كشف الإسقاطات — يجد المناظر الأمامية والجانبية والعلوية في الرسم. 2. تحديد موقع الأبعاد — يبرز جميع أسهم الأبعاد وحقول النص. 3. التعرف على الرموز الخاصة — يقرأ تسميات الخيط (M10) ودرجات التسامح (IT6) وخشونة السطح (Ra 3.2). 4. خطوط الملامح — يفصل الملامح المرئية عن الخطوط المساعدة. 5. الخطوط المساعدة — يجد خطوط المحاور والعناصر الإنشائية المساعدة. 6. الأسهم والمؤشرات — يحدد موقع جميع أنواع الأسهم والقيم النصية المرتبطة بها.
يتم توصيل OCR مخصص مع YOLO — الحلول القياسية تعاني من قراءة الملاحظات المكتوبة بخط اليد والرموز الخاصة مثل ∅ (القطر) واتفاقيات تسمية الخيوط. تم تدريب الشبكة العصبية على مجموعة بيانات مع تعليقات الخبراء. منطق الأسهم هو رسم بياني مرجح: إذا بدأ سهم في النقطة A وعبر الكائن الهندسي B وانتهى بالقرب من النص C، فإن القيمة C تتعلق بالكائن A. في الواقع الأمر أكثر تعقيدًا: يمكن للأسهم أن تكون متقطعة أو على شكل S، يمكن لعدة أسهم أن تشير إلى مكان واحد، مما يسبب غموضًا.
الواقع يعترض الطريق
كشفت الاختبارات على رسومات الإنتاج عن مشاكل غير موجودة في مجموعات البيانات المثالية:
- الفحوصات الضبابية — رسومات بعمر 20 سنة وفحوصات من آلات النسخ والبقع المائية والعلامات العشوائية بالقلم الرصاص.
- الحريات الطباعية — يمكن كتابة الخيوط بصيغة "Ø10×1.5" أو "M10" أو حتى رسمها كنابض.
- التعليقات الملونة — الأبعاد المبرزة بقلم أحمر، لكن OCR غالبًا ما يصفي الخطوط الحمراء كضوضاء.
- الأوراق المكتظة — 30+ بعد على الرسم والأسهم تتقاطع مما يسبب التباسًا.
جاء الحل من تعزيز البيانات: تم توليد رسومات اصطناعية مع إضافة ضوضاء وفوضى وتغييرات التباين ومحاكاة الفحوصات القديمة. بعد التدريب على مجموعة البيانات الموسعة، تحسنت الجودة على الرسومات الضبابية من 68% إلى 92%.
ماذا يعني هذا
أتمتة قراءة الرسومات مثال على كيفية استبدال العمل البشري بمزيج من الأدوات المتاحة للجمهور (YOLO) والمنطق الهندسي (رسم بياني للأسهم) والتضبيط المتخصص. للتصنيع فهي تسريع بمعدل 15x: بدلاً من 30 دقيقة من الإدخال اليدوي — دقيقتان في الطيار الآلي. للأعمال التجارية — تسليم أسرع للعروض دون إدخال البيانات يدويًا.