Bỏ qua nội dung

So sánh kỹ thuật: YOLOX so với EfficientDet để phát hiện đối tượng

Ultralytics YOLO Các mô hình nổi tiếng về tốc độ và độ chính xác trong các tác vụ phát hiện đối tượng. Trang này cung cấp so sánh kỹ thuật chi tiết giữa hai mô hình phát hiện đối tượng nổi bật: YOLOXEfficientDet . Chúng tôi sẽ khám phá thiết kế kiến trúc, chuẩn mực hiệu suất, phương pháp đào tạo và ứng dụng tối ưu của chúng để hỗ trợ bạn lựa chọn mô hình phù hợp nhất cho nhu cầu thị giác máy tính của mình.

YOLOX: Máy dò không neo hiệu suất cao

YOLOX ("Bạn chỉ nhìn một lần X") là máy dò vật thể không cần neo tiên tiến do Megvii phát triển. Nó được thiết kế để đơn giản và hiệu suất cao, thu hẹp khoảng cách giữa nghiên cứu và các ứng dụng công nghiệp thực tế.

Kiến trúc và các tính năng chính

YOLOX nổi bật với mô hình phát hiện không có mỏ neo, đơn giản hóa kiến trúc và tăng hiệu quả. Những điểm nổi bật chính về kiến trúc bao gồm:

  • Thiết kế không có điểm neo : Loại bỏ sự phức tạp của các hộp neo, giúp triển khai đơn giản hơn và có khả năng khái quát hóa tốt hơn, đặc biệt đối với các đối tượng có tỷ lệ khung hình khác nhau.
  • Đầu tách rời : Tách các đầu phân loại và định vị, tăng cường tối ưu hóa cho từng tác vụ và cải thiện độ chính xác tổng thể.
  • Chiến lược đào tạo nâng cao : Sử dụng các kỹ thuật như gán nhãn SimOTA và tăng cường dữ liệu mạnh mẽ (MixUp và Mosaic) để đảm bảo đào tạo mạnh mẽ và cải thiện hiệu suất.

Tác giả: Zheng Ge, Songtao Liu, Feng Wang, Zeming Li và Jian Sun Tổ chức: Megvii Ngày: 18/07/2021 Liên kết Arxiv: https://arxiv.org/abs/2107.08430 Liên kết GitHub: https://github.com/Megvii-BaseDetection/YOLOX Liên kết tài liệu: https://yolox.readthedocs.io/en/latest/

Số liệu hiệu suất

Các mô hình YOLOX cung cấp sự cân bằng hấp dẫn giữa tốc độ và độ chính xác. Như minh họa trong bảng so sánh, YOLOX đạt được điểm mAP cạnh tranh trong khi vẫn duy trì tốc độ suy luận nhanh, khiến nó phù hợp với các ứng dụng thời gian thực. Để biết hiệu suất chi tiết trên nhiều kích thước mô hình khác nhau, vui lòng tham khảo bảng bên dưới.

Các trường hợp sử dụng

  • Phát hiện đối tượng theo thời gian thực : Lý tưởng cho các ứng dụng yêu cầu phát hiện nhanh, chẳng hạn như hệ thống an ninh và phân tích video trực tiếp.
  • Thiết bị Edge : Hiệu suất hiệu quả trên các thiết bị có tài nguyên hạn chế như NVIDIA Jetson và nền tảng di động.
  • Hệ thống tự động : Phù hợp với robot và xe tự hành vì nhận thức nhanh và chính xác là rất quan trọng.

Điểm mạnh và điểm yếu

Điểm mạnh:

  • Tốc độ suy luận cao : Kiến trúc không có mỏ neo và thiết kế được tối ưu hóa góp phần xử lý nhanh chóng.
  • Tính đơn giản : Thiết kế hợp lý giúp việc đào tạo và triển khai dễ dàng hơn so với các mô hình dựa trên mỏ neo.
  • Cân bằng tốt giữa độ chính xác và tốc độ : Mang lại độ chính xác cạnh tranh mà không làm giảm tốc độ suy luận.

Điểm yếu:

  • mAP : Mặc dù có hiệu quả cao, nhưng nó có thể kém chính xác hơn một số mô hình lớn hơn, phức tạp hơn trong một số trường hợp nhất định.

Tìm hiểu thêm về YOLOX

EfficientDet: Phát hiện đối tượng có thể mở rộng và hiệu quả

EfficientDet , được phát triển bởi Google Nghiên cứu, nổi tiếng về khả năng mở rộng và hiệu quả trong phát hiện đối tượng. Nó sử dụng một họ các mô hình đạt được độ chính xác tiên tiến với ít tham số và FLOPs hơn đáng kể so với các máy dò trước đây.

Kiến trúc và các tính năng chính

EfficientDet giới thiệu một số cải tiến nhằm nâng cao hiệu quả và độ chính xác:

  • BiFPN (Mạng kim tự tháp tính năng hai chiều) : Cho phép kết hợp tính năng đa quy mô hiệu quả, giúp mạng sử dụng hiệu quả các tính năng ở nhiều độ phân giải khác nhau.
  • Tăng quy mô hợp chất: Tăng quy mô đồng đều tất cả các chiều của mạng (xương sống, BiFPN và mạng dự đoán hộp/lớp) bằng cách sử dụng một hệ số hợp chất duy nhất, giúp đơn giản hóa quá trình tăng quy mô và tối ưu hóa hiệu suất.
  • Mạng xương sống hiệu quả : Sử dụng EfficientNet làm mạng xương sống, được biết đến với tính hiệu quả và khả năng trích xuất tính năng mạnh mẽ.

Tác giả: Mingxing Tan, Ruoming Pang và Quoc V. Le Tổ chức: Google Ngày: 2019-11-20 Liên kết Arxiv: https://arxiv.org/abs/1911.09070 Liên kết GitHub: https://github.com/ google /automl/tree/master/efficientdet Liên kết tài liệu: https://github.com/ google /automl/tree/master/efficientdet#readme

Số liệu hiệu suất

Các mô hình EfficientDet được thiết kế để đạt hiệu suất cao trên nhiều quy mô khác nhau, cung cấp nhiều mô hình từ d0 đến d7. Chúng đạt điểm mAP tuyệt vời với số lượng tham số và FLOP tương đối nhỏ, khiến chúng phù hợp để triển khai trong môi trường hạn chế về tài nguyên. Tham khảo bảng so sánh để biết số liệu chi tiết.

Các trường hợp sử dụng

  • Triển khai trên thiết bị di động và biên : Kích thước mô hình nhỏ và hiệu quả cao của EfficientDet khiến nó trở nên lý tưởng cho các thiết bị di động và tình huống điện toán biên.
  • Các ứng dụng yêu cầu độ chính xác cao với nguồn lực hạn chế : Phù hợp cho các ứng dụng đòi hỏi độ chính xác cao nhưng nguồn lực tính toán bị hạn chế, chẳng hạn như kiểm tra chất lượng trên các thiết bị biên.
  • Thiết bị chạy bằng pin : Thiết kế tiết kiệm năng lượng cho phép triển khai trên các thiết bị chạy bằng pin và các ứng dụng IoT.

Điểm mạnh và điểm yếu

Điểm mạnh:

  • Hiệu quả cao : Đạt được độ chính xác tiên tiến với ít tham số và FLOP hơn, dẫn đến suy luận nhanh hơn và chi phí tính toán thấp hơn.
  • Khả năng mở rộng : Phương pháp mở rộng hợp chất cho phép mở rộng mô hình một cách dễ dàng để đáp ứng các yêu cầu về độ chính xác và tài nguyên khác nhau.
  • Độ chính xác : Hiệu suất mạnh mẽ về mAP, đặc biệt đối với các mô hình vừa và nhỏ.

Điểm yếu:

  • Tốc độ suy luận : Mặc dù hiệu quả, EfficientDet có thể chậm hơn các mô hình được tối ưu hóa cụ thể về tốc độ như YOLOv10 hoặc YOLOv8 , đặc biệt là đối với các biến thể lớn hơn.

Tìm hiểu thêm về EfficientDet

Bảng so sánh hiệu suất

Người mẫu kích cỡ
(điểm ảnh)
giá trị mAP
50-95
Tốc độ
CPU ONNX
(bệnh đa xơ cứng)
Tốc độ
T4 TensorRT10
(bệnh đa xơ cứng)
tham số
(Nam)
Thất bại
(B)
YOLOXnano 416 25.8 - - 0.91 1.08
YOLOXtiny 416 32.8 - - 5.06 6.45
YOLOX là 640 40.5 - 2.56 9.0 26.8
YOLOXm 640 46.9 - 5.43 25.3 73.8
YOLOXLl 640 49.7 - 9.04 54.2 155.6
YOLOXx 640 51.1 - 16.1 99.1 281.9
Hiệu quảDet-d0 640 34.6 10.2 3.92 3.9 2.54
Hiệu quảDet-d1 640 40.5 13.5 7.31 6.6 6.1
Hiệu quảDet-d2 640 43.0 17.7 10.92 8.1 11.0
Hiệu quảDet-d3 640 47.5 28.0 19.59 12.0 24.9
Hiệu quảDet-d4 640 49.7 42.8 33.55 20.7 55.2
Hiệu quảDet-d5 640 51.5 72.5 67.86 33.7 130.0
Hiệu quảDet-d6 640 52.6 92.8 89.29 51.9 226.0
Hiệu quảDet-d7 640 53.7 122.0 128.07 51.9 325.0

Khám phá những so sánh sâu sắc khác giữa các mô hình phát hiện đối tượng có sẵn trong Ultralytics Tài liệu:

📅 Được tạo ra cách đây 1 năm ✏️ Đã cập nhật cách đây 1 tháng

Bình luận