So sánh kỹ thuật: YOLOX so với PP-YOLOE+ để phát hiện đối tượng
Việc lựa chọn mô hình phát hiện đối tượng phù hợp là rất quan trọng đối với các tác vụ thị giác máy tính. Trang này cung cấp so sánh kỹ thuật chi tiết giữa YOLOX và PP-YOLOE+ , hai mô hình không neo hiện đại, nêu bật kiến trúc, hiệu suất và trường hợp sử dụng của chúng để hỗ trợ đưa ra quyết định sáng suốt.
YOLOX: Máy dò không neo hiệu suất cao
YOLOX , được Megvii giới thiệu vào tháng 7 năm 2021, là một mô hình phát hiện đối tượng không có neo được biết đến với tính đơn giản và hiệu suất cao. Nó nhằm mục đích thu hẹp khoảng cách giữa nghiên cứu và các ứng dụng công nghiệp bằng cách cung cấp một kiến trúc hợp lý nhưng hiệu quả.
Kiến trúc và các tính năng chính
YOLOX đơn giản hóa YOLO loạt bằng cách áp dụng phương pháp không neo, loại bỏ nhu cầu tính toán hộp neo phức tạp. Những cải tiến kiến trúc chính bao gồm:
- Phát hiện không có điểm neo : Tính năng này loại bỏ các hộp neo, giúp đơn giản hóa thiết kế và giảm số lượng siêu tham số.
- Đầu tách rời : YOLOX tách riêng đầu phân loại và đầu định vị, cải thiện hiệu suất, đặc biệt là về độ chính xác.
- Gán nhãn SimOTA : Một chiến lược gán nhãn tiên tiến giúp tối ưu hóa quá trình đào tạo bằng cách gán mục tiêu một cách động dựa trên các hộp giới hạn được dự đoán.
- Tăng cường dữ liệu mạnh mẽ : Sử dụng các phép tăng cường MixUp và Mosaic để tăng cường tính mạnh mẽ và khả năng khái quát.
Số liệu hiệu suất
Các mô hình YOLOX thể hiện sự cân bằng mạnh mẽ giữa độ chính xác và tốc độ. Như được chỉ ra trong bảng so sánh, YOLOX đạt được điểm mAP cạnh tranh với thời gian suy luận hiệu quả. Ví dụ, YOLOX-x đạt được 51,1% mAP trên tập dữ liệu COCO val.
Các trường hợp sử dụng
- Lái xe tự động : Phát hiện vật thể theo thời gian thực rất quan trọng đối với hệ thống an toàn và điều hướng tự động.
- Kỹ thuật robot : Cho phép robot nhận thức và tương tác hiệu quả với môi trường xung quanh.
- Kiểm tra công nghiệp : Độ chính xác và tốc độ cao là điều cần thiết để kiểm soát chất lượng trong quá trình sản xuất.
Điểm mạnh và điểm yếu
Điểm mạnh:
- Đánh đổi giữa độ chính xác và tốc độ cao: Đạt được hiệu suất tuyệt vời về cả độ chính xác và tốc độ suy luận.
- Kiến trúc đơn giản hóa: Thiết kế không có mỏ neo giúp đơn giản hóa việc triển khai và giảm độ phức tạp trong tính toán.
- Hiệu suất mạnh mẽ trên mọi kích cỡ mô hình: Cung cấp các mô hình từ Nano đến X để phù hợp với nhiều hạn chế về tài nguyên khác nhau.
Điểm yếu:
- Tốc độ suy luận so với các mô hình thời gian thực: Mặc dù nhanh, các mô hình như YOLOv10 có thể cung cấp tốc độ suy luận thậm chí còn nhanh hơn, ưu tiên tốc độ hơn độ chính xác tối đa.
Chi tiết:
- Tác giả : Zheng Ge, Songtao Liu, Feng Wang, Zeming Li, và Jian Sun
- Tổ chức : Megvii
- Ngày : 2021-07-18
- Arxiv Link : YOLOX: Vượt qua YOLO Series năm 2021
- Liên kết GitHub : Megvii-BaseDetection/YOLOX
- Liên kết tài liệu : Tài liệu YOLOX
PP-YOLOE+: Sự xuất sắc không có neo từ PaddlePaddle
PP-YOLOE+ , phiên bản nâng cao của PP-YOLOE từ PaddlePaddle , được thiết kế để có độ chính xác và hiệu quả cao trong việc phát hiện đối tượng. Được Baidu phát hành vào tháng 4 năm 2022, nó dựa trên mô hình không neo, tập trung vào các ứng dụng công nghiệp đòi hỏi khả năng phát hiện mạnh mẽ và chính xác.
Kiến trúc và các tính năng chính
PP-YOLOE+ nhấn mạnh vào độ chính xác mà không làm giảm tốc độ suy luận, khiến nó phù hợp với các tác vụ phát hiện đối tượng đòi hỏi cao. Kiến trúc của nó bao gồm:
- Thiết kế không có điểm neo : Đơn giản hóa mô hình và giảm việc điều chỉnh siêu tham số bằng cách loại bỏ các hộp neo.
- Đầu tách rời : Tương tự như YOLOX, nó sử dụng đầu tách rời để phân loại và định vị nhằm cải thiện độ chính xác.
- VariFocal Loss : Sử dụng VariFocal Loss để phân loại tinh chỉnh và hồi quy hộp giới hạn, nâng cao độ chính xác của phát hiện.
- CSPRepResNet Backbone và ELAN Neck : Sử dụng kiến trúc backbone và neck hiệu quả để trích xuất và tổng hợp tính năng.
Số liệu hiệu suất
Các mô hình PP-YOLOE+ cung cấp sự cân bằng mạnh mẽ giữa độ chính xác và tốc độ. Bảng so sánh thể hiện điểm mAP cạnh tranh và hiệu quả TensorRT thời gian suy luận. PP-YOLOE+x đạt 54,7% mAP trên tập dữ liệu COCO val, cho thấy độ chính xác tuyệt vời.
Các trường hợp sử dụng
- Kiểm tra chất lượng công nghiệp : Độ chính xác cao rất quan trọng để xác định lỗi trong sản xuất.
- Hiệu quả tái chế : Phát hiện vật thể chính xác giúp cải thiện quá trình phân loại tự động tại các nhà máy tái chế.
- Giám sát : Cần có khả năng phát hiện mạnh mẽ và chính xác để giám sát đáng tin cậy trong các hệ thống an ninh.
Điểm mạnh và điểm yếu
Điểm mạnh:
- Độ chính xác cao : Ưu tiên đạt được độ chính xác tiên tiến nhất trong việc phát hiện đối tượng.
- Thiết kế hiệu quả : Cân bằng giữa độ chính xác cao với tốc độ suy luận hợp lý.
- Tập trung vào công nghiệp : Thích hợp cho các ứng dụng công nghiệp đòi hỏi khả năng phát hiện vật thể đáng tin cậy và chính xác.
Điểm yếu:
- Độ phức tạp : Mặc dù không có mỏ neo, nhưng các cải tiến "+" làm tăng thêm độ phức tạp so với các mô hình đơn giản hơn.
- Khóa hệ sinh thái : Chủ yếu trong PaddlePaddle hệ sinh thái, có thể là một sự cân nhắc cho những người dùng thích các khuôn khổ khác.
Tài liệu PP-YOLOE+ (PaddleDetection)
Chi tiết:
- Tác giả : PaddlePaddle Tác giả
- Tổ chức : Baidu
- Ngày : 2022-04-02
- Liên kết Arxiv : PP-YOLOE: Một máy dò vật thể không có mỏ neo đang tiến hóa
- Liên kết GitHub : PaddlePaddle /PaddleDetection
- Liên kết tài liệu : Tài liệu PP-YOLOE
Bảng so sánh mô hình
Người mẫu | kích cỡ (điểm ảnh) |
giá trị mAP 50-95 |
Tốc độ CPU ONNX (bệnh đa xơ cứng) |
Tốc độ T4 TensorRT10 (bệnh đa xơ cứng) |
tham số (Nam) |
Thất bại (B) |
---|---|---|---|---|---|---|
YOLOXnano | 416 | 25.8 | - | - | 0.91 | 1.08 |
YOLOXtiny | 416 | 32.8 | - | - | 5.06 | 6.45 |
YOLOX là | 640 | 40.5 | - | 2.56 | 9.0 | 26.8 |
YOLOXm | 640 | 46.9 | - | 5.43 | 25.3 | 73.8 |
YOLOXLl | 640 | 49.7 | - | 9.04 | 54.2 | 155.6 |
YOLOXx | 640 | 51.1 | - | 16.1 | 99.1 | 281.9 |
PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
Các mô hình khác
Người dùng quan tâm đến YOLOX và PP-YOLOE+ cũng có thể tìm thấy Ultralytics YOLO các mô hình sâu sắc, chẳng hạn như:
- YOLOv5 : Được biết đến với hiệu quả và tính linh hoạt hợp lý, cung cấp nhiều kích thước mô hình phù hợp với nhiều ứng dụng khác nhau. Tìm hiểu thêm về YOLOv5 .
- YOLOv8 : Phiên bản mới nhất trong YOLO chuỗi, cung cấp sự cân bằng về tốc độ và độ chính xác trong các nhiệm vụ phát hiện đối tượng, phân đoạn và ước tính tư thế. Tìm hiểu thêm về YOLOv8 .
- YOLOv10 : Đại diện cho công nghệ tiên tiến nhất trong phát hiện đối tượng theo thời gian thực, được thiết kế để có tốc độ và hiệu quả vượt trội, lý tưởng cho các thiết bị biên. Tìm hiểu thêm về YOLOv10 .
- YOLO11 : Mới nhất Ultralytics YOLO mô hình, xác định lại ranh giới về những gì có thể trong AI với hiệu suất và khả năng được nâng cao. Tìm hiểu thêm về YOLO11 .