Bỏ qua nội dung

YOLOv7 so với YOLOX: So sánh kỹ thuật chi tiết

Việc lựa chọn mô hình phát hiện đối tượng tối ưu là một quyết định quan trọng đối với các dự án thị giác máy tính. Ultralytics cung cấp một bộ các mô hình tiên tiến và hiểu được điểm mạnh cụ thể của chúng là chìa khóa để đạt được hiệu suất cao nhất. Trang này cung cấp so sánh kỹ thuật của hai mô hình phổ biến, YOLOv7 và YOLOX, nêu chi tiết các sắc thái kiến trúc, điểm chuẩn hiệu suất và các kịch bản triển khai lý tưởng của chúng.

YOLOv7: Phát hiện hiệu quả và độ chính xác cao

YOLOv7, được giới thiệu vào tháng 7 năm 2022 bởi Chien-Yao Wang, Alexey Bochkovskiy và Hong-Yuan Mark Liao từ Viện Khoa học Thông tin, Academia Sinica, Đài Loan, được thiết kế để phát hiện đối tượng hiệu quả và chính xác. Nó xây dựng dựa trên YOLO mô hình, kết hợp những cải tiến về kiến trúc để tăng tốc độ và độ chính xác.

Kiến trúc và các tính năng chính

YOLOv7 (paper: arXiv , GitHub: Official Repo ) giới thiệu một số cải tiến, bao gồm Efficient Layer Aggregation Network (E-ELAN) giúp tối ưu hóa việc sử dụng tham số và tính toán. Nó cũng sử dụng các kỹ thuật mở rộng mô hình và tham số hóa lại theo kế hoạch để tăng cường hiệu quả đào tạo và độ chính xác phát hiện. Các tính năng này cho phép YOLOv7 đạt được kết quả tiên tiến với kích thước mô hình tương đối nhỏ gọn, phù hợp với các ứng dụng thời gian thực và triển khai trên các thiết bị có tài nguyên hạn chế. Để biết thêm thông tin chi tiết, hãy tham khảo tài liệu chính thức của YOLOv7 .

Số liệu hiệu suất và trường hợp sử dụng

YOLOv7 vượt trội trong các tình huống đòi hỏi cả suy luận nhanh và độ chính xác cao. Các số liệu mAP và tốc độ ấn tượng của nó khiến nó trở thành lựa chọn mạnh mẽ cho các ứng dụng như phân tích video thời gian thực, hệ thống lái xe tự động và xử lý hình ảnh độ phân giải cao. Trong các triển khai thành phố thông minh , YOLOv7 có thể được sử dụng để quản lý giao thông hoặc tăng cường hệ thống an ninh để phát hiện mối đe dọa ngay lập tức.

Tìm hiểu thêm về YOLOv7

YOLOX: Sự xuất sắc không cần neo trong phát hiện đối tượng

YOLOX, được phát triển bởi Zheng Ge, Songtao Liu, Feng Wang, Zeming Li và Jian Sun tại Megvii và phát hành vào tháng 7 năm 2021 (bài báo: arXiv , GitHub: Official Repo ), áp dụng phương pháp không cần mỏ neo để phát hiện đối tượng, đơn giản hóa quy trình phát hiện và cải thiện khả năng khái quát hóa.

Kiến trúc và các tính năng chính

YOLOX (tài liệu: ReadTheDocs ) khác với truyền thống YOLO mô hình bằng cách loại bỏ các hộp neo được xác định trước. Thiết kế không có neo này làm giảm độ phức tạp và có thể dẫn đến hiệu suất tốt hơn, đặc biệt là đối với các đối tượng có hình dạng khác nhau. Nó kết hợp các đầu tách rời cho các tác vụ phân loại và hồi quy riêng biệt và sử dụng các chiến lược gán nhãn tiên tiến như SimOTA (Gán vận chuyển tối ưu đơn giản hóa). Những lựa chọn kiến trúc này góp phần vào tính mạnh mẽ và dễ triển khai của YOLOX.

Số liệu hiệu suất và trường hợp sử dụng

YOLOX cung cấp sự cân bằng hấp dẫn giữa tốc độ và độ chính xác. Bản chất không có neo của nó có thể đặc biệt có lợi trong các ứng dụng xử lý các kích thước vật thể và tỷ lệ khung hình khác nhau. YOLOX rất phù hợp cho các ứng dụng như robot , kiểm tra công nghiệp và phân tích bán lẻ. Ví dụ, trong sản xuất , nó có thể được sử dụng để kiểm tra chất lượng để phát hiện lỗi hiệu quả mà không bị giới hạn bởi các hình dạng neo được xác định trước.

Tìm hiểu thêm về YOLOX

Người mẫu kích cỡ
(điểm ảnh)
giá trị mAP
50-95
Tốc độ
CPU ONNX
(bệnh đa xơ cứng)
Tốc độ
T4 TensorRT10
(bệnh đa xơ cứng)
tham số
(Nam)
Thất bại
(B)
YOLOv7l 640 51.4 - 6.84 36.9 104.7
YOLOv7x 640 53.1 - 11.57 71.3 189.9
YOLOXnano 416 25.8 - - 0.91 1.08
YOLOXtiny 416 32.8 - - 5.06 6.45
YOLOX là 640 40.5 - 2.56 9.0 26.8
YOLOXm 640 46.9 - 5.43 25.3 73.8
YOLOXLl 640 49.7 - 9.04 54.2 155.6
YOLOXx 640 51.1 - 16.1 99.1 281.9

Người dùng quan tâm đến những người khác YOLO các mô hình cũng có thể xem xét khám phá:

  • YOLOv8 : Phiên bản mới nhất trong YOLO loạt từ Ultralytics , mang lại hiệu suất và tính linh hoạt tiên tiến.
  • YOLOv5 : Được biết đến vì dễ sử dụng và hiệu quả, có nhiều kích cỡ mẫu mã cho các nhu cầu khác nhau.
  • YOLOv6 : Một khuôn khổ phát hiện đối tượng một giai đoạn hiệu suất cao.
  • YOLO11 : Một mô hình mới tập trung vào việc cải thiện hiệu suất và hiệu quả.
📅 Được tạo ra cách đây 1 năm ✏️ Đã cập nhật cách đây 1 tháng

Bình luận