Bỏ qua nội dung

YOLOv9 so với PP-YOLOE+: So sánh kỹ thuật chi tiết

Việc lựa chọn mô hình phát hiện đối tượng phù hợp là rất quan trọng đối với các tác vụ thị giác máy tính. Trang này cung cấp so sánh kỹ thuật giữa YOLOv9PP-YOLOE+ , xem xét kiến trúc, hiệu suất và ứng dụng của chúng để hướng dẫn lựa chọn của bạn.

YOLOv9: Thông tin Gradient có thể lập trình

YOLOv9 , được giới thiệu vào năm 2024, đại diện cho một bước tiến đáng kể trong YOLO loạt bài tập trung vào việc lưu giữ thông tin thông qua các thiết kế kiến trúc mới lạ.

  • Kiến trúc : YOLOv9 được biên soạn bởi Chien-Yao Wang và Hong-Yuan Mark Liao từ Viện Khoa học Thông tin, Academia Sinica, Đài Loan. Bài viết giới thiệu Programmable Gradient Information (PGI) và Generalized Efficient Layer Aggregation Network (GELAN). PGI giải quyết tình trạng mất thông tin trong quá trình truyền mạng sâu, trong khi GELAN tối ưu hóa hiệu quả mạng. Sự kết hợp sáng tạo này nhằm mục đích cải thiện độ chính xác mà không làm tăng đáng kể chi phí tính toán. Bài báo gốc có sẵn trên arXiv . Kho lưu trữ GitHub chính thức cung cấp thông tin chi tiết về triển khai.
  • Hiệu suất : YOLOv9 đạt được hiệu suất tiên tiến với sự cân bằng giữa tốc độ và độ chính xác. Như được chỉ ra trong biểu đồ và bảng so sánh, các mô hình YOLOv9 thể hiện các giá trị mAP cao trong khi vẫn duy trì tốc độ suy luận cạnh tranh. Ví dụ, YOLOv9c đạt được 53,0% mAP val 50-95.
  • Trường hợp sử dụng : Hiệu quả và độ chính xác được cải thiện của YOLOv9 khiến nó phù hợp với nhiều ứng dụng khác nhau, bao gồm robot , xe tự hànhhệ thống an ninh , trong đó hiệu suất phát hiện cao là rất quan trọng với nguồn lực tính toán hạn chế.

Tìm hiểu thêm về YOLOv9

PP-YOLOE+: Phát hiện không neo nâng cao

PP-YOLOE+ , được phát triển bởi PaddlePaddle và được trình bày chi tiết trong khuôn khổ PaddleDetection của họ, là sự phát triển của dòng PP-YOLOE, được biết đến với phương pháp không cần neo và hiệu quả.

  • Kiến trúc : PP-YOLOE+ xây dựng dựa trên mô hình phát hiện không có neo, đơn giản hóa mô hình và giảm nhu cầu về các siêu tham số liên quan đến neo. Nó thường bao gồm các cải tiến so với PP-YOLOE cơ bản trong thiết kế xương sống, cổ và đầu phát hiện, thường kết hợp các kỹ thuật như đầu tách rời và VariFocal Loss để tinh chỉnh độ chính xác phát hiện. Tài liệu và triển khai có sẵn trên PaddleDetection GitHub .
  • Hiệu suất : Các mô hình PP-YOLOE+ được thiết kế để cung cấp sự cân bằng mạnh mẽ giữa độ chính xác và tốc độ suy luận. Như được thể hiện trong bảng so sánh, các mô hình PP-YOLOE+ như PP-YOLOE+m và PP-YOLOE+l cung cấp điểm mAP cạnh tranh và thời gian suy luận hiệu quả, khiến chúng trở nên linh hoạt cho nhiều ứng dụng khác nhau.
  • Trường hợp sử dụng : Thiết kế không cần neo và đặc tính hiệu suất cân bằng của PP-YOLOE+ khiến sản phẩm này phù hợp cho các ứng dụng như kiểm tra chất lượng công nghiệp , bán lẻ thông minhgiám sát môi trường , nơi cần phát hiện vật thể mạnh mẽ và hiệu quả.

Tài liệu PP-YOLOE+ (PaddleDetection)

Người mẫu kích cỡ
(điểm ảnh)
giá trị mAP
50-95
Tốc độ
CPU ONNX
(bệnh đa xơ cứng)
Tốc độ
T4 TensorRT10
(bệnh đa xơ cứng)
tham số
(Nam)
Thất bại
(B)
YOLOv9t 640 38.3 - 2.3 2.0 7.7
YOLOv9s 640 46.8 - 3.54 7.1 26.4
YOLOv9m 640 51.4 - 6.43 20.0 76.3
YOLOv9c 640 53.0 - 7.16 25.3 102.1
YOLOv9e 640 55.6 - 16.77 57.3 189.0
PP-YOLOE+t 640 39.9 - 2.84 4.85 19.15
PP-YOLOE+s 640 43.7 - 2.62 7.93 17.36
PP-YOLOE+m 640 49.8 - 5.56 23.43 49.91
PP-YOLOE+l 640 52.9 - 8.36 52.2 110.07
PP-YOLOE+x 640 54.7 - 14.3 98.42 206.59

Đối với người dùng quan tâm đến các mô hình phát hiện đối tượng hiệu suất cao khác, Ultralytics cũng cung cấp YOLOv5 , YOLOv7, YOLOv8 và tiên tiến YOLO11 , mỗi mô hình có điểm mạnh và tối ưu hóa riêng. Khám phá tài liệu mô hình của chúng tôi để biết thêm thông tin chi tiết và so sánh.

📅 Được tạo ra cách đây 1 năm ✏️ Đã cập nhật cách đây 1 tháng

Bình luận