YOLOv5 Mô hình lắp ráp

📚 Hướng dẫn này giải thích cách sử dụng Ultralytics YOLOv5 🚀 mô hình tổng hợp trong quá trình thử nghiệm và suy luận để cải thiện mAP và Recall .

Từ học tập tập thể :

Mô hình hóa tổng hợp là một quá trình trong đó nhiều mô hình đa dạng được tạo ra để dự đoán một kết quả, bằng cách sử dụng nhiều thuật toán mô hình hóa khác nhau hoặc sử dụng các tập dữ liệu đào tạo khác nhau. Sau đó, mô hình tổng hợp sẽ tổng hợp dự đoán của từng mô hình cơ sở và đưa ra một dự đoán cuối cùng cho dữ liệu chưa biết. Động lực sử dụng mô hình tổng hợp là để giảm lỗi tổng quát của dự đoán. Miễn là các mô hình cơ sở đa dạng và độc lập, lỗi dự đoán của mô hình sẽ giảm khi sử dụng phương pháp tổng hợp. Phương pháp này tìm kiếm sự thông thái của đám đông khi đưa ra dự đoán. Mặc dù mô hình tổng hợp có nhiều mô hình cơ sở trong mô hình, nhưng nó hoạt động và thực hiện như một mô hình duy nhất.

Trước khi bạn bắt đầu

Sao chép kho lưu trữ và cài đặt requirements.txt trong môi trường Python >=3.8.0 , bao gồm PyTorch >=1.8 . Các mô hình và tập dữ liệu tự động tải xuống từ phiên bản mới nhất YOLOv5 giải phóng .

git clone https://github.com/ultralytics/yolov5 # clone
cd yolov5
pip install -r requirements.txt # install

Kiểm tra bình thường

Trước khi tổng hợp, hãy thiết lập hiệu suất cơ sở của một mô hình duy nhất. Lệnh này kiểm tra YOLOv5x trên COCO val2017 ở kích thước hình ảnh 640 pixel. yolov5x.pt là mô hình lớn nhất và chính xác nhất hiện có. Các tùy chọn khác là yolov5s.pt, yolov5m.pt Và yolov5l.pthoặc điểm kiểm tra của riêng bạn từ việc đào tạo một tập dữ liệu tùy chỉnh ./weights/best.pt. Để biết chi tiết về tất cả các mẫu có sẵn, hãy xem bảng điểm kiểm tra được đào tạo trước.

python val.py --weights yolov5x.pt --data coco.yaml --img 640 --half

Đầu ra:

val: data=./data/coco.yaml, weights=['yolov5x.pt'], batch_size=32, imgsz=640, conf_thres=0.001, iou_thres=0.65, task=val, device=, single_cls=False, augment=False, verbose=False, save_txt=False, save_hybrid=False, save_conf=False, save_json=True, project=runs/val, name=exp, exist_ok=False, half=True
YOLOv5 🚀 v5.0-267-g6a3ee7c torch 1.9.0+cu102 CUDA:0 (Tesla P100-PCIE-16GB, 16280.875MB)

Fusing layers...
Model Summary: 476 layers, 87730285 parameters, 0 gradients

val: Scanning '../datasets/coco/val2017' images and labels...4952 found, 48 missing, 0 empty, 0 corrupted: 100% 5000/5000 [00:01<00:00, 2846.03it/s]
val: New cache created: ../datasets/coco/val2017.cache
               Class     Images     Labels          P          R     mAP@.5 mAP@.5:.95: 100% 157/157 [02:30<00:00,  1.05it/s]
                 all       5000      36335      0.746      0.626       0.68       0.49
Speed: 0.1ms pre-process, 22.4ms inference, 1.4ms NMS per image at shape (32, 3, 640, 640)  # <--- baseline speed

Evaluating pycocotools mAP... saving runs/val/exp/yolov5x_predictions.json...
...
 Average Precision  (AP) @[ IoU=0.50:0.95 | area=   all | maxDets=100 ] = 0.504  # <--- baseline mAP
 Average Precision  (AP) @[ IoU=0.50      | area=   all | maxDets=100 ] = 0.688
 Average Precision  (AP) @[ IoU=0.75      | area=   all | maxDets=100 ] = 0.546
 Average Precision  (AP) @[ IoU=0.50:0.95 | area= small | maxDets=100 ] = 0.351
 Average Precision  (AP) @[ IoU=0.50:0.95 | area=medium | maxDets=100 ] = 0.551
 Average Precision  (AP) @[ IoU=0.50:0.95 | area= large | maxDets=100 ] = 0.644
 Average Recall     (AR) @[ IoU=0.50:0.95 | area=   all | maxDets=  1 ] = 0.382
 Average Recall     (AR) @[ IoU=0.50:0.95 | area=   all | maxDets= 10 ] = 0.628
 Average Recall     (AR) @[ IoU=0.50:0.95 | area=   all | maxDets=100 ] = 0.681  # <--- baseline mAR
 Average Recall     (AR) @[ IoU=0.50:0.95 | area= small | maxDets=100 ] = 0.524
 Average Recall     (AR) @[ IoU=0.50:0.95 | area=medium | maxDets=100 ] = 0.735
 Average Recall     (AR) @[ IoU=0.50:0.95 | area= large | maxDets=100 ] = 0.826

Kiểm tra tổng hợp

Nhiều mô hình được đào tạo trước có thể được tập hợp lại với nhau tại thời điểm thử nghiệm và suy luận chỉ bằng cách thêm các mô hình bổ sung vào --weights đối số trong bất kỳ lệnh val.py hoặc detect.py hiện có nào. Ví dụ này kiểm tra một tập hợp gồm 2 mô hình cùng nhau:

YOLOv5x
YOLOv5l6

python val.py --weights yolov5x.pt yolov5l6.pt --data coco.yaml --img 640 --half

Đầu ra:

val: data=./data/coco.yaml, weights=['yolov5x.pt', 'yolov5l6.pt'], batch_size=32, imgsz=640, conf_thres=0.001, iou_thres=0.6, task=val, device=, single_cls=False, augment=False, verbose=False, save_txt=False, save_hybrid=False, save_conf=False, save_json=True, project=runs/val, name=exp, exist_ok=False, half=True
YOLOv5 🚀 v5.0-267-g6a3ee7c torch 1.9.0+cu102 CUDA:0 (Tesla P100-PCIE-16GB, 16280.875MB)

Fusing layers...
Model Summary: 476 layers, 87730285 parameters, 0 gradients  # Model 1
Fusing layers...
Model Summary: 501 layers, 77218620 parameters, 0 gradients  # Model 2
Ensemble created with ['yolov5x.pt', 'yolov5l6.pt']  # Ensemble notice

val: Scanning '../datasets/coco/val2017.cache' images and labels... 4952 found, 48 missing, 0 empty, 0 corrupted: 100% 5000/5000 [00:00<00:00, 49695545.02it/s]
               Class     Images     Labels          P          R     mAP@.5 mAP@.5:.95: 100% 157/157 [03:58<00:00,  1.52s/it]
                 all       5000      36335      0.747      0.637      0.692      0.502
Speed: 0.1ms pre-process, 39.5ms inference, 2.0ms NMS per image at shape (32, 3, 640, 640)  # <--- ensemble speed

Evaluating pycocotools mAP... saving runs/val/exp3/yolov5x_predictions.json...
...
 Average Precision  (AP) @[ IoU=0.50:0.95 | area=   all | maxDets=100 ] = 0.515  # <--- ensemble mAP
 Average Precision  (AP) @[ IoU=0.50      | area=   all | maxDets=100 ] = 0.699
 Average Precision  (AP) @[ IoU=0.75      | area=   all | maxDets=100 ] = 0.557
 Average Precision  (AP) @[ IoU=0.50:0.95 | area= small | maxDets=100 ] = 0.356
 Average Precision  (AP) @[ IoU=0.50:0.95 | area=medium | maxDets=100 ] = 0.563
 Average Precision  (AP) @[ IoU=0.50:0.95 | area= large | maxDets=100 ] = 0.668
 Average Recall     (AR) @[ IoU=0.50:0.95 | area=   all | maxDets=  1 ] = 0.387
 Average Recall     (AR) @[ IoU=0.50:0.95 | area=   all | maxDets= 10 ] = 0.638
 Average Recall     (AR) @[ IoU=0.50:0.95 | area=   all | maxDets=100 ] = 0.689  # <--- ensemble mAR
 Average Recall     (AR) @[ IoU=0.50:0.95 | area= small | maxDets=100 ] = 0.526
 Average Recall     (AR) @[ IoU=0.50:0.95 | area=medium | maxDets=100 ] = 0.743
 Average Recall     (AR) @[ IoU=0.50:0.95 | area= large | maxDets=100 ] = 0.844

Suy luận tổng hợp

Thêm các mô hình bổ sung vào --weights đối số để chạy suy luận tổng hợp:

python detect.py --weights yolov5x.pt yolov5l6.pt --img 640 --source data/images

Đầu ra:

YOLOv5 🚀 v5.0-267-g6a3ee7c torch 1.9.0+cu102 CUDA:0 (Tesla P100-PCIE-16GB, 16280.875MB)

Fusing layers...
Model Summary: 476 layers, 87730285 parameters, 0 gradients
Fusing layers...
Model Summary: 501 layers, 77218620 parameters, 0 gradients
Ensemble created with ['yolov5x.pt', 'yolov5l6.pt']

image 1/2 /content/yolov5/data/images/bus.jpg: 640x512 4 persons, 1 bus, 1 tie, Done. (0.063s)
image 2/2 /content/yolov5/data/images/zidane.jpg: 384x640 3 persons, 2 ties, Done. (0.056s)
Results saved to runs/detect/exp2
Done. (0.223s)

YOLO kết quả suy luận

Lợi ích của việc lắp ghép mô hình

Mô hình lắp ráp với YOLOv5 cung cấp một số lợi thế:

Độ chính xác được cải thiện : Như đã chứng minh trong các ví dụ trên, việc kết hợp nhiều mô hình sẽ làm tăng mAP từ 0,504 lên 0,515 và mAR từ 0,681 lên 0,689.
Tổng quát hóa tốt hơn : Việc kết hợp nhiều mô hình khác nhau giúp giảm hiện tượng quá khớp và cải thiện hiệu suất trên dữ liệu đa dạng.
Độ tin cậy được cải thiện : Các tập hợp thường tin cậy hơn với nhiễu và giá trị ngoại lai trong dữ liệu.
Điểm mạnh bổ sung : Các mô hình khác nhau có thể vượt trội trong việc phát hiện các loại vật thể khác nhau hoặc trong các điều kiện môi trường khác nhau.

Sự đánh đổi chính là thời gian suy luận tăng lên, như thể hiện trong số liệu tốc độ (22,4ms cho mô hình đơn so với 39,5ms cho mô hình tổng thể).

Khi nào sử dụng Model Ensembling

Hãy cân nhắc sử dụng mô hình tổng hợp trong các tình huống sau:

Khi độ chính xác quan trọng hơn tốc độ suy luận
Đối với các ứng dụng quan trọng, nơi mà các kết quả âm tính giả phải được giảm thiểu
Khi xử lý hình ảnh khó với ánh sáng, sự che khuất hoặc tỷ lệ khác nhau
Trong các cuộc thi hoặc đánh giá chuẩn mực khi cần hiệu suất tối đa

Đối với các ứng dụng thời gian thực có yêu cầu độ trễ nghiêm ngặt, suy luận mô hình đơn có thể phù hợp hơn.

Môi trường được hỗ trợ

Ultralytics cung cấp nhiều môi trường sẵn sàng sử dụng, mỗi môi trường đều được cài đặt sẵn các thành phần phụ thuộc cần thiết như CUDA , CUDNN , Python và PyTorch để khởi động dự án của bạn.

Miễn phí GPU Sổ tay:
Google Cloud : Hướng dẫn bắt đầu nhanh GCP
Amazon : Hướng dẫn bắt đầu nhanh AWS
Azure : Hướng dẫn bắt đầu nhanh AzureML
Người lái tàu: Hướng dẫn khởi động nhanh Docker

Tình trạng dự án

Huy hiệu này cho biết tất cả các thử nghiệm Tích hợp liên tục (CI) YOLOv5 GitHub Actions đều vượt qua thành công. Các thử nghiệm CI này kiểm tra nghiêm ngặt chức năng và hiệu suất của YOLOv5 trên nhiều khía cạnh chính: đào tạo , xác thực , suy luận , xuất và chuẩn . Chúng đảm bảo hoạt động nhất quán và đáng tin cậy trên macOS, Windows và Ubuntu, với các bài kiểm tra được tiến hành sau mỗi 24 giờ và sau mỗi lần cam kết mới.

📅 Được tạo ra cách đây 1 năm ✏️ Đã cập nhật cách đây 8 ngày