YOLOv9 so với PP-YOLOE+: So sánh kỹ thuật chi tiết
Việc lựa chọn mô hình phát hiện đối tượng phù hợp là rất quan trọng đối với các tác vụ thị giác máy tính. Trang này cung cấp so sánh kỹ thuật giữa YOLOv9 và PP-YOLOE+ , xem xét kiến trúc, hiệu suất và ứng dụng của chúng để hướng dẫn lựa chọn của bạn.
YOLOv9: Thông tin Gradient có thể lập trình
YOLOv9 , được giới thiệu vào năm 2024, đại diện cho một bước tiến đáng kể trong YOLO loạt bài tập trung vào việc lưu giữ thông tin thông qua các thiết kế kiến trúc mới lạ.
- Kiến trúc : YOLOv9 được biên soạn bởi Chien-Yao Wang và Hong-Yuan Mark Liao từ Viện Khoa học Thông tin, Academia Sinica, Đài Loan. Bài viết giới thiệu Programmable Gradient Information (PGI) và Generalized Efficient Layer Aggregation Network (GELAN). PGI giải quyết tình trạng mất thông tin trong quá trình truyền mạng sâu, trong khi GELAN tối ưu hóa hiệu quả mạng. Sự kết hợp sáng tạo này nhằm mục đích cải thiện độ chính xác mà không làm tăng đáng kể chi phí tính toán. Bài báo gốc có sẵn trên arXiv . Kho lưu trữ GitHub chính thức cung cấp thông tin chi tiết về triển khai.
- Hiệu suất : YOLOv9 đạt được hiệu suất tiên tiến với sự cân bằng giữa tốc độ và độ chính xác. Như được chỉ ra trong biểu đồ và bảng so sánh, các mô hình YOLOv9 thể hiện các giá trị mAP cao trong khi vẫn duy trì tốc độ suy luận cạnh tranh. Ví dụ, YOLOv9c đạt được 53,0% mAP val 50-95.
- Trường hợp sử dụng : Hiệu quả và độ chính xác được cải thiện của YOLOv9 khiến nó phù hợp với nhiều ứng dụng khác nhau, bao gồm robot , xe tự hành và hệ thống an ninh , trong đó hiệu suất phát hiện cao là rất quan trọng với nguồn lực tính toán hạn chế.
PP-YOLOE+: Phát hiện không neo nâng cao
PP-YOLOE+ , được phát triển bởi PaddlePaddle và được trình bày chi tiết trong khuôn khổ PaddleDetection của họ, là sự phát triển của dòng PP-YOLOE, được biết đến với phương pháp không cần neo và hiệu quả.
- Kiến trúc : PP-YOLOE+ xây dựng dựa trên mô hình phát hiện không có neo, đơn giản hóa mô hình và giảm nhu cầu về các siêu tham số liên quan đến neo. Nó thường bao gồm các cải tiến so với PP-YOLOE cơ bản trong thiết kế xương sống, cổ và đầu phát hiện, thường kết hợp các kỹ thuật như đầu tách rời và VariFocal Loss để tinh chỉnh độ chính xác phát hiện. Tài liệu và triển khai có sẵn trên PaddleDetection GitHub .
- Hiệu suất : Các mô hình PP-YOLOE+ được thiết kế để cung cấp sự cân bằng mạnh mẽ giữa độ chính xác và tốc độ suy luận. Như được thể hiện trong bảng so sánh, các mô hình PP-YOLOE+ như PP-YOLOE+m và PP-YOLOE+l cung cấp điểm mAP cạnh tranh và thời gian suy luận hiệu quả, khiến chúng trở nên linh hoạt cho nhiều ứng dụng khác nhau.
- Trường hợp sử dụng : Thiết kế không cần neo và đặc tính hiệu suất cân bằng của PP-YOLOE+ khiến sản phẩm này phù hợp cho các ứng dụng như kiểm tra chất lượng công nghiệp , bán lẻ thông minh và giám sát môi trường , nơi cần phát hiện vật thể mạnh mẽ và hiệu quả.
Tài liệu PP-YOLOE+ (PaddleDetection)
Người mẫu | kích cỡ (điểm ảnh) |
giá trị mAP 50-95 |
Tốc độ CPU ONNX (bệnh đa xơ cứng) |
Tốc độ T4 TensorRT10 (bệnh đa xơ cứng) |
tham số (Nam) |
Thất bại (B) |
---|---|---|---|---|---|---|
YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
Đối với người dùng quan tâm đến các mô hình phát hiện đối tượng hiệu suất cao khác, Ultralytics cũng cung cấp YOLOv5 , YOLOv7, YOLOv8 và tiên tiến YOLO11 , mỗi mô hình có điểm mạnh và tối ưu hóa riêng. Khám phá tài liệu mô hình của chúng tôi để biết thêm thông tin chi tiết và so sánh.