تجميع نماذج YOLOv5
📚 يشرح هذا الدليل كيفية استخدام تجميع النماذج (model ensembling) في Ultralytics YOLOv5 أثناء الاختبار والاستنتاج لتحسين mAP و Recall.
من تعلم التجميع:
نمذجة التجميع هي عملية يتم فيها إنشاء نماذج متنوعة متعددة للتنبؤ بنتيجة ما، إما باستخدام العديد من خوارزميات النمذجة المختلفة أو باستخدام مجموعات مختلفة من بيانات التدريب. يقوم نموذج التجميع بعد ذلك بتجميع توقعات كل نموذج أساسي وينتج عن ذلك تنبؤ نهائي واحد للبيانات غير المرئية. الدافع لاستخدام نماذج التجميع هو تقليل خطأ التعميم في التنبؤ. طالما أن النماذج الأساسية متنوعة ومستقلة، فإن خطأ التنبؤ للنموذج ينخفض عند استخدام نهج التجميع. يسعى هذا النهج إلى استغلال حكمة الجمهور في إجراء التنبؤ. على الرغم من أن نموذج التجميع يحتوي على نماذج أساسية متعددة داخل النموذج، إلا أنه يعمل ويؤدي كنموذج واحد.
قبل البدء
قم باستنساخ المستودع وتثبيت requirements.txt في بيئة Python>=3.8.0، بما في ذلك PyTorch>=1.8. يتم تنزيل النماذج ومجموعات البيانات تلقائياً من أحدث إصدار لـ YOLOv5.
git clone https://github.com/ultralytics/yolov5 # clone
cd yolov5
pip install -r requirements.txt # installالاختبار بشكل عادي
قبل التجميع، قم بتحديد الأداء الأساسي لنموذج واحد. يقوم هذا الأمر باختبار YOLOv5x على COCO val2017 بحجم صورة 640 بكسل. yolov5x.pt هو أكبر نموذج وأكثرها دقة متاح. الخيارات الأخرى هي yolov5s.pt و yolov5m.pt و yolov5l.pt، أو نقطة فحص خاصة بك من تدريب مجموعة بيانات مخصصة ./weights/best.pt. للحصول على تفاصيل حول جميع النماذج المتاحة، راجع جدول نقاط الفحص المدربة مسبقًا.
python val.py --weights yolov5x.pt --data coco.yaml --img 640 --halfالمخرجات:
val: data=./data/coco.yaml, weights=['yolov5x.pt'], batch_size=32, imgsz=640, conf_thres=0.001, iou_thres=0.65, task=val, device=, single_cls=False, augment=False, verbose=False, save_txt=False, save_conf=False, save_json=True, project=runs/val, name=exp, exist_ok=False, half=True
YOLOv5 🚀 v5.0-267-g6a3ee7c torch 1.9.0+cu102 CUDA:0 (Tesla P100-PCIE-16GB, 16280.875MB)
Fusing layers...
Model Summary: 476 layers, 87730285 parameters, 0 gradients
val: Scanning '../datasets/coco/val2017' images and labels...4952 found, 48 missing, 0 empty, 0 corrupted: 100% 5000/5000 [00:01<00:00, 2846.03it/s]
val: New cache created: ../datasets/coco/val2017.cache
Class Images Labels P R mAP@.5 mAP@.5:.95: 100% 157/157 [02:30<00:00, 1.05it/s]
all 5000 36335 0.746 0.626 0.68 0.49
Speed: 0.1ms pre-process, 22.4ms inference, 1.4ms NMS per image at shape (32, 3, 640, 640) # <--- baseline speed
Evaluating pycocotools mAP... saving runs/val/exp/yolov5x_predictions.json...
...
Average Precision (AP) @[ IoU=0.50:0.95 | area= all | maxDets=100 ] = 0.504 # <--- baseline mAP
Average Precision (AP) @[ IoU=0.50 | area= all | maxDets=100 ] = 0.688
Average Precision (AP) @[ IoU=0.75 | area= all | maxDets=100 ] = 0.546
Average Precision (AP) @[ IoU=0.50:0.95 | area= small | maxDets=100 ] = 0.351
Average Precision (AP) @[ IoU=0.50:0.95 | area=medium | maxDets=100 ] = 0.551
Average Precision (AP) @[ IoU=0.50:0.95 | area= large | maxDets=100 ] = 0.644
Average Recall (AR) @[ IoU=0.50:0.95 | area= all | maxDets= 1 ] = 0.382
Average Recall (AR) @[ IoU=0.50:0.95 | area= all | maxDets= 10 ] = 0.628
Average Recall (AR) @[ IoU=0.50:0.95 | area= all | maxDets=100 ] = 0.681 # <--- baseline mAR
Average Recall (AR) @[ IoU=0.50:0.95 | area= small | maxDets=100 ] = 0.524
Average Recall (AR) @[ IoU=0.50:0.95 | area=medium | maxDets=100 ] = 0.735
Average Recall (AR) @[ IoU=0.50:0.95 | area= large | maxDets=100 ] = 0.826اختبار التجميع
يمكن تجميع نماذج متعددة مدربة مسبقًا معًا في وقت الاختبار والاستنتاج ببساطة عن طريق إضافة نماذج إضافية إلى وسيطة --weights في أي أمر val.py أو detect.py موجود. يختبر هذا المثال تجميع نموذجين معًا:
- YOLOv5x
- YOLOv5l6
python val.py --weights yolov5x.pt yolov5l6.pt --data coco.yaml --img 640 --halfيمكنك إدراج العديد من نقاط الفحص التي ترغب فيها، بما في ذلك الأوزان المخصصة مثل runs/train/exp-5/weights/best.pt. سيقوم YOLOv5 تلقائيًا بتشغيل كل نموذج، ومحاذاة التنبؤات على أساس كل صورة على حدة، ومتوسط المخرجات قبل إجراء NMS.
المخرجات:
val: data=./data/coco.yaml, weights=['yolov5x.pt', 'yolov5l6.pt'], batch_size=32, imgsz=640, conf_thres=0.001, iou_thres=0.6, task=val, device=, single_cls=False, augment=False, verbose=False, save_txt=False, save_conf=False, save_json=True, project=runs/val, name=exp, exist_ok=False, half=True
YOLOv5 🚀 v5.0-267-g6a3ee7c torch 1.9.0+cu102 CUDA:0 (Tesla P100-PCIE-16GB, 16280.875MB)
Fusing layers...
Model Summary: 476 layers, 87730285 parameters, 0 gradients # Model 1
Fusing layers...
Model Summary: 501 layers, 77218620 parameters, 0 gradients # Model 2
Ensemble created with ['yolov5x.pt', 'yolov5l6.pt'] # Ensemble notice
val: Scanning '../datasets/coco/val2017.cache' images and labels... 4952 found, 48 missing, 0 empty, 0 corrupted: 100% 5000/5000 [00:00<00:00, 49695545.02it/s]
Class Images Labels P R mAP@.5 mAP@.5:.95: 100% 157/157 [03:58<00:00, 1.52s/it]
all 5000 36335 0.747 0.637 0.692 0.502
Speed: 0.1ms pre-process, 39.5ms inference, 2.0ms NMS per image at shape (32, 3, 640, 640) # <--- ensemble speed
Evaluating pycocotools mAP... saving runs/val/exp-3/yolov5x_predictions.json...
...
Average Precision (AP) @[ IoU=0.50:0.95 | area= all | maxDets=100 ] = 0.515 # <--- ensemble mAP
Average Precision (AP) @[ IoU=0.50 | area= all | maxDets=100 ] = 0.699
Average Precision (AP) @[ IoU=0.75 | area= all | maxDets=100 ] = 0.557
Average Precision (AP) @[ IoU=0.50:0.95 | area= small | maxDets=100 ] = 0.356
Average Precision (AP) @[ IoU=0.50:0.95 | area=medium | maxDets=100 ] = 0.563
Average Precision (AP) @[ IoU=0.50:0.95 | area= large | maxDets=100 ] = 0.668
Average Recall (AR) @[ IoU=0.50:0.95 | area= all | maxDets= 1 ] = 0.387
Average Recall (AR) @[ IoU=0.50:0.95 | area= all | maxDets= 10 ] = 0.638
Average Recall (AR) @[ IoU=0.50:0.95 | area= all | maxDets=100 ] = 0.689 # <--- ensemble mAR
Average Recall (AR) @[ IoU=0.50:0.95 | area= small | maxDets=100 ] = 0.526
Average Recall (AR) @[ IoU=0.50:0.95 | area=medium | maxDets=100 ] = 0.743
Average Recall (AR) @[ IoU=0.50:0.95 | area= large | maxDets=100 ] = 0.844استنتاج التجميع
أضف نماذج إضافية إلى وسيطة --weights لتشغيل استنتاج التجميع:
python detect.py --weights yolov5x.pt yolov5l6.pt --img 640 --source data/imagesالمخرجات:
YOLOv5 🚀 v5.0-267-g6a3ee7c torch 1.9.0+cu102 CUDA:0 (Tesla P100-PCIE-16GB, 16280.875MB)
Fusing layers...
Model Summary: 476 layers, 87730285 parameters, 0 gradients
Fusing layers...
Model Summary: 501 layers, 77218620 parameters, 0 gradients
Ensemble created with ['yolov5x.pt', 'yolov5l6.pt']
image 1/2 /content/yolov5/data/images/bus.jpg: 640x512 4 persons, 1 bus, 1 tie, Done. (0.063s)
image 2/2 /content/yolov5/data/images/zidane.jpg: 384x640 3 persons, 2 ties, Done. (0.056s)
Results saved to runs/detect/exp-2
Done. (0.223s)
فوائد تجميع النماذج
يوفر تجميع النماذج مع YOLOv5 العديد من المزايا:
- دقة محسنة: كما هو موضح في الأمثلة أعلاه، يؤدي تجميع نماذج متعددة إلى زيادة mAP من 0.504 إلى 0.515 و mAR من 0.681 إلى 0.689.
- تعميم أفضل: يساعد الجمع بين نماذج متنوعة في تقليل الإفراط في التخصيص (overfitting) وتحسين الأداء على بيانات متنوعة.
- متانة معززة: عادة ما تكون المجمعات أكثر متانة تجاه الضوضاء والقيم المتطرفة في البيانات.
- نقاط القوة التكميلية: قد تتفوق نماذج مختلفة في اكتشاف أنواع مختلفة من الكائنات أو في ظروف بيئية مختلفة.
المقايضة الأساسية هي زيادة وقت الاستنتاج، كما هو موضح في مقاييس السرعة (22.4 مللي ثانية لنموذج واحد مقابل 39.5 مللي ثانية للتجميع).
متى تستخدم تجميع النماذج
فكر في استخدام تجميع النماذج في هذه السيناريوهات:
- عندما تكون الدقة أكثر أهمية من سرعة الاستنتاج
- للتطبيقات المهمة حيث يجب تقليل النتائج السلبية الكاذبة
- عند معالجة صور صعبة ذات إضاءة متفاوتة، أو انسداد، أو مقياس متغير
- أثناء المسابقات أو المقارنة المعيارية حيث يتطلب أقصى أداء
بالنسبة للتطبيقات في الوقت الفعلي ذات متطلبات زمن انتقال صارمة، قد يكون استنتاج النموذج الفردي أكثر ملاءمة.
البيئات المدعومة
توفر Ultralytics مجموعة من البيئات الجاهزة للاستخدام، كل منها مثبت مسبقًا بالتبعيات الأساسية مثل CUDA، وCUDNN، وPython، وPyTorch، لبدء مشاريعك.
- دفاتر ملاحظات GPU مجانية:
- Google Cloud: دليل التشغيل السريع لـ GCP
- Amazon: دليل التشغيل السريع لـ AWS
- Azure: دليل التشغيل السريع لـ AzureML
- Docker: دليل التشغيل السريع لـ Docker
حالة المشروع
تشير هذه الشارة إلى أن جميع اختبارات التكامل المستمر (CI) الخاصة بـ YOLOv5 GitHub Actions تمر بنجاح. تتحقق اختبارات CI هذه بصرامة من وظائف وأداء YOLOv5 عبر جوانب رئيسية مختلفة: التدريب، والتحقق، والاستدلال، والتصدير، والمعايير. وهي تضمن التشغيل المتسق والموثوق على macOS وWindows وUbuntu، مع إجراء اختبارات كل 24 ساعة وعند كل التزام (commit) جديد.