So sánh kỹ thuật: YOLOX so với EfficientDet để phát hiện đối tượng
Ultralytics YOLO Các mô hình nổi tiếng về tốc độ và độ chính xác trong các tác vụ phát hiện đối tượng. Trang này cung cấp so sánh kỹ thuật chi tiết giữa hai mô hình phát hiện đối tượng nổi bật: YOLOX và EfficientDet . Chúng tôi sẽ khám phá thiết kế kiến trúc, chuẩn mực hiệu suất, phương pháp đào tạo và ứng dụng tối ưu của chúng để hỗ trợ bạn lựa chọn mô hình phù hợp nhất cho nhu cầu thị giác máy tính của mình.
YOLOX: Máy dò không neo hiệu suất cao
YOLOX ("Bạn chỉ nhìn một lần X") là máy dò vật thể không cần neo tiên tiến do Megvii phát triển. Nó được thiết kế để đơn giản và hiệu suất cao, thu hẹp khoảng cách giữa nghiên cứu và các ứng dụng công nghiệp thực tế.
Kiến trúc và các tính năng chính
YOLOX nổi bật với mô hình phát hiện không có mỏ neo, đơn giản hóa kiến trúc và tăng hiệu quả. Những điểm nổi bật chính về kiến trúc bao gồm:
- Thiết kế không có điểm neo : Loại bỏ sự phức tạp của các hộp neo, giúp triển khai đơn giản hơn và có khả năng khái quát hóa tốt hơn, đặc biệt đối với các đối tượng có tỷ lệ khung hình khác nhau.
- Đầu tách rời : Tách các đầu phân loại và định vị, tăng cường tối ưu hóa cho từng tác vụ và cải thiện độ chính xác tổng thể.
- Chiến lược đào tạo nâng cao : Sử dụng các kỹ thuật như gán nhãn SimOTA và tăng cường dữ liệu mạnh mẽ (MixUp và Mosaic) để đảm bảo đào tạo mạnh mẽ và cải thiện hiệu suất.
Tác giả: Zheng Ge, Songtao Liu, Feng Wang, Zeming Li và Jian Sun Tổ chức: Megvii Ngày: 18/07/2021 Liên kết Arxiv: https://arxiv.org/abs/2107.08430 Liên kết GitHub: https://github.com/Megvii-BaseDetection/YOLOX Liên kết tài liệu: https://yolox.readthedocs.io/en/latest/
Số liệu hiệu suất
Các mô hình YOLOX cung cấp sự cân bằng hấp dẫn giữa tốc độ và độ chính xác. Như minh họa trong bảng so sánh, YOLOX đạt được điểm mAP cạnh tranh trong khi vẫn duy trì tốc độ suy luận nhanh, khiến nó phù hợp với các ứng dụng thời gian thực. Để biết hiệu suất chi tiết trên nhiều kích thước mô hình khác nhau, vui lòng tham khảo bảng bên dưới.
Các trường hợp sử dụng
- Phát hiện đối tượng theo thời gian thực : Lý tưởng cho các ứng dụng yêu cầu phát hiện nhanh, chẳng hạn như hệ thống an ninh và phân tích video trực tiếp.
- Thiết bị Edge : Hiệu suất hiệu quả trên các thiết bị có tài nguyên hạn chế như NVIDIA Jetson và nền tảng di động.
- Hệ thống tự động : Phù hợp với robot và xe tự hành vì nhận thức nhanh và chính xác là rất quan trọng.
Điểm mạnh và điểm yếu
Điểm mạnh:
- Tốc độ suy luận cao : Kiến trúc không có mỏ neo và thiết kế được tối ưu hóa góp phần xử lý nhanh chóng.
- Tính đơn giản : Thiết kế hợp lý giúp việc đào tạo và triển khai dễ dàng hơn so với các mô hình dựa trên mỏ neo.
- Cân bằng tốt giữa độ chính xác và tốc độ : Mang lại độ chính xác cạnh tranh mà không làm giảm tốc độ suy luận.
Điểm yếu:
- mAP : Mặc dù có hiệu quả cao, nhưng nó có thể kém chính xác hơn một số mô hình lớn hơn, phức tạp hơn trong một số trường hợp nhất định.
EfficientDet: Phát hiện đối tượng có thể mở rộng và hiệu quả
EfficientDet , được phát triển bởi Google Nghiên cứu, nổi tiếng về khả năng mở rộng và hiệu quả trong phát hiện đối tượng. Nó sử dụng một họ các mô hình đạt được độ chính xác tiên tiến với ít tham số và FLOPs hơn đáng kể so với các máy dò trước đây.
Kiến trúc và các tính năng chính
EfficientDet giới thiệu một số cải tiến nhằm nâng cao hiệu quả và độ chính xác:
- BiFPN (Mạng kim tự tháp tính năng hai chiều) : Cho phép kết hợp tính năng đa quy mô hiệu quả, giúp mạng sử dụng hiệu quả các tính năng ở nhiều độ phân giải khác nhau.
- Tăng quy mô hợp chất: Tăng quy mô đồng đều tất cả các chiều của mạng (xương sống, BiFPN và mạng dự đoán hộp/lớp) bằng cách sử dụng một hệ số hợp chất duy nhất, giúp đơn giản hóa quá trình tăng quy mô và tối ưu hóa hiệu suất.
- Mạng xương sống hiệu quả : Sử dụng EfficientNet làm mạng xương sống, được biết đến với tính hiệu quả và khả năng trích xuất tính năng mạnh mẽ.
Tác giả: Mingxing Tan, Ruoming Pang và Quoc V. Le Tổ chức: Google Ngày: 2019-11-20 Liên kết Arxiv: https://arxiv.org/abs/1911.09070 Liên kết GitHub: https://github.com/ google /automl/tree/master/efficientdet Liên kết tài liệu: https://github.com/ google /automl/tree/master/efficientdet#readme
Số liệu hiệu suất
Các mô hình EfficientDet được thiết kế để đạt hiệu suất cao trên nhiều quy mô khác nhau, cung cấp nhiều mô hình từ d0 đến d7. Chúng đạt điểm mAP tuyệt vời với số lượng tham số và FLOP tương đối nhỏ, khiến chúng phù hợp để triển khai trong môi trường hạn chế về tài nguyên. Tham khảo bảng so sánh để biết số liệu chi tiết.
Các trường hợp sử dụng
- Triển khai trên thiết bị di động và biên : Kích thước mô hình nhỏ và hiệu quả cao của EfficientDet khiến nó trở nên lý tưởng cho các thiết bị di động và tình huống điện toán biên.
- Các ứng dụng yêu cầu độ chính xác cao với nguồn lực hạn chế : Phù hợp cho các ứng dụng đòi hỏi độ chính xác cao nhưng nguồn lực tính toán bị hạn chế, chẳng hạn như kiểm tra chất lượng trên các thiết bị biên.
- Thiết bị chạy bằng pin : Thiết kế tiết kiệm năng lượng cho phép triển khai trên các thiết bị chạy bằng pin và các ứng dụng IoT.
Điểm mạnh và điểm yếu
Điểm mạnh:
- Hiệu quả cao : Đạt được độ chính xác tiên tiến với ít tham số và FLOP hơn, dẫn đến suy luận nhanh hơn và chi phí tính toán thấp hơn.
- Khả năng mở rộng : Phương pháp mở rộng hợp chất cho phép mở rộng mô hình một cách dễ dàng để đáp ứng các yêu cầu về độ chính xác và tài nguyên khác nhau.
- Độ chính xác : Hiệu suất mạnh mẽ về mAP, đặc biệt đối với các mô hình vừa và nhỏ.
Điểm yếu:
- Tốc độ suy luận : Mặc dù hiệu quả, EfficientDet có thể chậm hơn các mô hình được tối ưu hóa cụ thể về tốc độ như YOLOv10 hoặc YOLOv8 , đặc biệt là đối với các biến thể lớn hơn.
Bảng so sánh hiệu suất
Người mẫu | kích cỡ (điểm ảnh) |
giá trị mAP 50-95 |
Tốc độ CPU ONNX (bệnh đa xơ cứng) |
Tốc độ T4 TensorRT10 (bệnh đa xơ cứng) |
tham số (Nam) |
Thất bại (B) |
---|---|---|---|---|---|---|
YOLOXnano | 416 | 25.8 | - | - | 0.91 | 1.08 |
YOLOXtiny | 416 | 32.8 | - | - | 5.06 | 6.45 |
YOLOX là | 640 | 40.5 | - | 2.56 | 9.0 | 26.8 |
YOLOXm | 640 | 46.9 | - | 5.43 | 25.3 | 73.8 |
YOLOXLl | 640 | 49.7 | - | 9.04 | 54.2 | 155.6 |
YOLOXx | 640 | 51.1 | - | 16.1 | 99.1 | 281.9 |
Hiệu quảDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
Hiệu quảDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
Hiệu quảDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
Hiệu quảDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
Hiệu quảDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
Hiệu quảDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
Hiệu quảDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
Hiệu quảDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
So sánh liên quan
Khám phá những so sánh sâu sắc khác giữa các mô hình phát hiện đối tượng có sẵn trong Ultralytics Tài liệu:
- YOLOv8 so với YOLOX : So sánh giữa Ultralytics YOLOv8 và YOLOX.
- YOLOv7 so với YOLOX : Phân tích chi tiết về kiến trúc và hiệu suất của YOLOv7 và YOLOX.
- YOLOv5 so với YOLOX : So sánh hiệu quả và tính linh hoạt của YOLOv5 và YOLOX.
- YOLOX so với YOLO11 : So sánh kỹ thuật giữa YOLOX và Ultralytics YOLO11 .
- EfficientDet so với YOLOv5 : Đánh giá hiệu quả của EfficientDet so với YOLOv5 .
- EfficientDet so với YOLOv7 : So sánh hiệu suất giữa EfficientDet và YOLOv7.
- EfficientDet so với YOLOv8 : Phân tích điểm mạnh và điểm yếu của EfficientDet và YOLOv8 .
- EfficientDet so với YOLOv10 : So sánh các mẫu mới nhất, EfficientDet và YOLOv10.